阿里巴巴的Qwen3和Moonshot的Kimi-K2突破了10大AI排名,逼近美国大模型

两个新的中国人工智能模型闯入开源和开源模型的前10名排行榜,突显出中国在缩小与美国领先开发商的差距方面取得的进展。
阿里巴巴集团控股的1万亿参数Qwen3-max-preview模型在LMArena(由加州大学伯克利分校的研究人员发起的人工智能模型评估平台)最新的“文本竞技场”排名中首次亮相,名列第六,成为中国模型中的佼佼者。
与此同时,阿里巴巴支持的初创企业Moonshot AI更新的Kimi-K2车型与其他七个模型并列第八,包括DeepSeek R1和xAI的Grok 4,巩固了其作为全球首要开源模型之一的地位。
qwen 3-max-preview——阿里巴巴迄今为止最大的人工智能模型——和Kimi-K2-0905都于周五发布。阿里巴巴拥有《南华早报》。
这一成就与一年前形成鲜明对比,当时LMArena基于用户反馈的前10名排行榜中没有中国模特。用户向两个匿名模型提交提示,并投票选择提供更好答案的模型。模特的身份随后被揭露。
与静态基准不同,LMArena的动态“竞技场”格式使模型相互竞争,从而产生基于用户偏好和最新模型更新的排名。
在LMArena基于文本生成评估模型的文本排行榜上,Qwen3-max-preview的得分为1428分,仅次于美国巨头OpenAI、Anthropic和谷歌DeepMind的领先模型。
与Qwen系列中的其他型号相比,阿里巴巴没有开源Qwen3-max-preview,其完整的发布日期尚未公布。
Kimi-K2-0905的接受度也很高,用户称赞它的经济性和新扩展的上下文窗口,这两者对于要求苛刻的编码任务都至关重要。自上周五开源以来,它已经成为人工智能开发平台Hugging Face上最热门的模型之一,下载量超过4500次。
根据领先的人工智能基准咨询公司人工智能分析(Artificial Analysis)的整体智能指数,Kimi-K2-0905与7月推出的原始K2模型相比仅提高了2分,落后于领先的闭源美国模型,以及Qwen3 235B 2507和qwen 3 2507等中国开源模型DeepSeek R1 0528.
然而,该咨询公司表示,更新后的模型显示出代理能力的实质性增强,包括高级编码和客户服务。
人工智能已经成为中国发展最快的行业之一。根据工业和信息化部周一发布的数据,中国人工智能公司的数量从2020年的1454家激增至目前的5000多家,相当于每11个小时就有一家新公司。