就在昨晚,全球规模最大的AI开源社区Hugging Face做出了一个史无前例的决定:自掏腰包,为智谱AI刚刚开源的旗舰大模型GLM-5.2提供长达6小时的全球免费算力支持。
这是Hugging Face第一次专门为一款中国模型开辟这种“专属通道”,不少海外网友直呼这波操作堪称“倒贴式支持”。
GLM-5.2的热度仍在持续发酵。6月18日,特斯拉创始人马斯克在社交平台上被网友追问“中国大模型追上Fable级别水平大概还要多久,GLM-5.2是否已经缩短了这一差距”,他给出的回应是:“也许是(2027年)第一季度。”
紧接着,智谱创始人兼首席科学家唐杰隔空回应道:不会等那么久。
随后,硅谷知名风投a16z联合创始人Marc Andreessen以及Perplexity CEO Aravind Srinivas也相继在X上发表了自己的看法。大量海外用户站队认为马斯克的预测“太保守了”,相关话题一度刷屏社交平台。
美国头部模型下架,智谱顺势“补位”
马斯克这番表态出现在Anthropic新模型引发全球热议之后。
6月9日,Anthropic发布了号称迄今最强的两款模型——Claude Fable 5与Claude Mythos 5。然而仅仅几天后的6月13日,美国商务部出台出口管制规定,要求这两款模型不得向“非美籍用户”提供服务,Anthropic最终选择将两款模型全面下架。伴随这一管制措施而来的,是美国头部闭源模型访问门槛的全面收紧——前沿闭源模型的获取方式,正从此前的账户订阅制,逐步转向更强调身份核验、地区限制与资格审查的准入模式。
就在美国对Anthropic下达出口管制的同一天,智谱发文预告了即将上线的最强模型GLM-5.2,并留下一句意味深长的表态:前沿智能不该只属于极少数人,也不该被某些规则随意收回,它理应保持开放、可获取、可被构建,并服务于每一位开发者。
6月17日,GLM-5.2正式上线,采用最宽松的MIT协议开源开放,支持免费商用,并在长程编程任务上实现了百万级(1M)稳定上下文能力的量级跃升。
在架构设计上,GLM-5.2引入了名为IndexShare的新机制:每四层稀疏注意力共用同一个indexer,从而在百万token级别的超长上下文场景下,将单个token的计算开销降低约2.9倍。
成绩方面,在Artificial Analysis的综合排行榜上,GLM-5.2拿下51分,跻身全球模型前三,同时成为开源模型中的最强者;而在FrontierSWE、Terminal-Bench等代码与长程任务权威评测中,GLM-5.2与国际顶尖模型Claude Opus 4.8的差距已经收窄到1%–4%之间。
综合多项基准测试结果来看,GLM-5.2的表现已基本追平Claude Opus和Fable 5的水准——这也是开源模型的代码能力首次达到业内公认的顶尖闭源模型水平。
中国大模型,首次跻身全球第一梯队
自DeepSeek问世以来的一年多时间里,中国大模型厂商纷纷转向开源路线,本土开源模型阵营快速壮大,与美国头部模型之间的差距被迅速拉平。
在广受开发者欢迎的模型调用平台OpenRouter上,中国模型的调用占比已经从2024年底的1.2%飙升至超过50%,调用总量首次全面超越美国模型。
不过,调用量层面的反超,并不等同于前沿能力的全面领先。很长一段时间里,中国模型给外界留下的印象更多是“高性价比替代品”“开源补充选项”或是在某些单点能力上的追赶者。
GLM-5.2的不同之处在于,它开始尝试在智能体编程、长程复杂任务这类此前一直由Claude、GPT等闭源模型主导的领域,与对手正面竞争。
回顾时间线,今年春节期间,智谱曾以“Pony Alpha”这一隐匿身份将GLM-5模型悄悄上线OpenRouter,向全球开发者免费开放API调用体验,一度在技术圈引发大规模的“猜身份”热潮。这次从“单轮代码补全”向“智能体工程”的范式转变,也为国产开源模型确立了全球头部地位打下了基础。今年3月底发布的GLM-5.1进一步强化了代码能力,其支持8小时长程工作的能力,让中国大模型首次真正越过了Anthropic设定的“编程可用”基准线;而这次的GLM-5.2,则把代码能力直接推到了世界一流模型的门槛前。
美国知名开源模型研究员Nathan Lambert对此评价称,智谱GLM-5.2目前在智能体能力上已经超越了谷歌Gemini,这是一项极具分量的成就。这也意味着,长期以来由谷歌、OpenAI、Anthropic三家垄断全球模型顶尖能力的格局,第一次迎来了一家来自中国的模型企业入局。 开放生态,正在改写全球大模型竞争规则
GLM-5.2的发布,可以看作是中国大模型阶段性发展成果的一个缩影。
马斯克关于中国大模型可能在“一季度”追上Fable级别水平的判断,真正值得关注的,并不是这个时间点本身有多精确,而是它折射出全球市场正在重新评估中国前沿模型的追赶速度。
美国《财富》杂志对此评论称,美国对Fable和Mythos两款模型的禁令,恰恰印证了中国在科技自给自足方面所做出的更广泛努力是有效的,中国推进科技自主可控的步伐正在加快。
值得一提的是,GLM-5.2上线首日便完成了与华为昇腾、平头哥、摩尔线程、寒武纪、昆仑芯、沐曦、海光、壁仞等国产算力平台的全面适配;此前发布的国产大模型DeepSeek V4也已完成同类国产算力生态的全栈适配。这意味着,源自中国的全栈开放生态体系,正在助力全球AI产业走向更加开放包容、互利共赢的繁荣局面。
当美国闭源前沿模型越来越像一张需要层层审核资格的通行证时,GLM-5.2给出了另一种答案:前沿能力未必只能被封闭在少数几个平台之内,它同样可以选择开源,交还给全球开发者去自由构建。
在全球大模型竞争版图中,第一次出现了一个既能逼近顶级闭源模型体验、又主动选择开放路线的中国变量。
回到马斯克那句引发热议的“2027年第一季度”预测——从最初的代际落后,到局部单点突破,再到如今在智能体能力和长程复杂任务这些最硬核的领域里实现“同台竞技”,中国大模型追赶的计量单位,已经从“年”压缩到了“月”。
从这个角度看,GLM-5.2的意义远不止于智谱一次旗舰产品的发布,它更像是国产大模型从“追赶者叙事”迈入“同桌竞争”阶段的一个标志性节点。