阿里巴巴的Qwen3和Moonshot的Kimi-K2突破了10大AI排名，逼近美国大模型

2025-09-16 14:29

125

两个新的中国人工智能模型闯入开源和开源模型的前10名排行榜，突显出中国在缩小与美国领先开发商的差距方面取得的进展。

阿里巴巴集团控股的1万亿参数Qwen3-max-preview模型在LMArena(由加州大学伯克利分校的研究人员发起的人工智能模型评估平台)最新的“文本竞技场”排名中首次亮相，名列第六，成为中国模型中的佼佼者。

与此同时，阿里巴巴支持的初创企业Moonshot AI更新的Kimi-K2车型与其他七个模型并列第八，包括DeepSeek R1和xAI的Grok 4，巩固了其作为全球首要开源模型之一的地位。

qwen 3-max-preview——阿里巴巴迄今为止最大的人工智能模型——和Kimi-K2-0905都于周五发布。阿里巴巴拥有《南华早报》。

这一成就与一年前形成鲜明对比，当时LMArena基于用户反馈的前10名排行榜中没有中国模特。用户向两个匿名模型提交提示，并投票选择提供更好答案的模型。模特的身份随后被揭露。

与静态基准不同，LMArena的动态“竞技场”格式使模型相互竞争，从而产生基于用户偏好和最新模型更新的排名。

在LMArena基于文本生成评估模型的文本排行榜上，Qwen3-max-preview的得分为1428分，仅次于美国巨头OpenAI、Anthropic和谷歌DeepMind的领先模型。

与Qwen系列中的其他型号相比，阿里巴巴没有开源Qwen3-max-preview，其完整的发布日期尚未公布。

Kimi-K2-0905的接受度也很高，用户称赞它的经济性和新扩展的上下文窗口，这两者对于要求苛刻的编码任务都至关重要。自上周五开源以来，它已经成为人工智能开发平台Hugging Face上最热门的模型之一，下载量超过4500次。

根据领先的人工智能基准咨询公司人工智能分析(Artificial Analysis)的整体智能指数，Kimi-K2-0905与7月推出的原始K2模型相比仅提高了2分，落后于领先的闭源美国模型，以及Qwen3 235B 2507和qwen 3 2507等中国开源模型DeepSeek R1 0528.

然而，该咨询公司表示，更新后的模型显示出代理能力的实质性增强，包括高级编码和客户服务。

人工智能已经成为中国发展最快的行业之一。根据工业和信息化部周一发布的数据，中国人工智能公司的数量从2020年的1454家激增至目前的5000多家，相当于每11个小时就有一家新公司。

好文章，需要你的鼓励