国产 AI 三巨头同日发力：GLM-5 开源领衔，MiniMax、DeepSeek 同步突袭

2026-02-12 20:49

2月11日，国产AI赛道迎来密集发布潮，智谱正式推出GLM5、MiniMax开放M2.5内测、DeepSeek灰度上线百万token上下文版本，三家企业同日亮剑，延续去年DeepSeek R1改写行业格局的竞争态势，为春节前的AI圈注入强劲活力。

一、智谱GLM5：开源标杆，参数与能力双飞跃

此前在OpenRouter平台引发热议的神秘模型“Pony Alpha”，正式官宣为智谱新一代旗舰模型GLM5，其核心亮点集中在参数升级、技术创新与开源生态三大维度：

核心配置翻倍：采用MoE架构，总参数从GLM4.5的3550亿跃升至7440亿，激活参数从320亿提升至400亿，预训练数据量从23T tokens扩容至28.5T tokens，基础能力全面强化。

技术亮点突出：集成DeepSeek的稀疏注意力技术（DSA），在保留长上下文处理能力的同时降低部署成本；创新研发Slime异步强化学习框架，解决大模型强化学习训练效率低的行业痛点，让模型可从长程交互中持续学习。

评测表现亮眼：在多项权威基准测试中斩获佳绩——SWEbench Verified以77.8%的成绩位居开源第一；TerminalBench 2.0得分56.2%，逼近Claude Opus 4.5的59.3%；BrowseComp（浏览器Agent能力）得分75.9%，超越Claude Opus 4.5（67.8%）与Gemini 3 Pro（59.2%）；在Vending Bench 2模拟售货机经营测试中，以4432美元账户余额接近Claude Opus 4.5，展现出极强的长期规划与资源管理能力。

开源+多场景可用：遵循MIT协议，在HuggingFace与ModelScope平台开放权重，支持vLLM和SGLang本地部署；提供chat.z.ai免费使用渠道，含Chat（轻量化问答）与Agent（生成Word/PDF/Excel文件）两种模式；开发者可通过bigmodel.cn调用API，兼容Claude Code和OpenClaw，GLM Coding Plan Max用户可直接使用，其他套餐逐步开放。发布后智谱股价暴涨32%，全球开源模型综合排名跃居第四、开源第一。

二、MiniMax M2.5：内测开启，编程能力再进阶

MiniMax同步开放新一代模型M2.5的网页端内测，延续其快速迭代节奏：

迭代背景：前身M2.1于2025年12月发布，以2300亿总参数（激活100亿）主打多语言编程能力，在SWEbench多语言测试中超越Claude Sonnet 4.5且成本更低；M2.5在训练过程中表现持续提升，工程负责人透露“投入算力越多，模型表现越亮眼”，呈现“痛苦而快乐的升级困境”。

使用方式：用户可通过MiniMax官网查询是否获得灰度内测资格，目前已有网友拿到权限并启动与GLM5的对比测试。作为1月9日港交所上市企业，MiniMax此次与智谱撞期发布，延续了两家公司IPO前后密集推新的竞争态势。

三、DeepSeek：闷声升级，百万上下文落地

DeepSeek以低调灰度测试的方式完成重要更新，聚焦长上下文能力突破：

核心升级：上下文窗口从此前V3.2版本的128K跃升至1M（百万）token，相当于可一次性处理《三体》三部曲级别的大体量文本，知识截止日期更新至2025年5月，大幅提升长文本处理与信息检索效率。

现状与展望：目前仍为纯文本模型，暂未支持多模态能力，此次灰度测试被视为V4正式版本发布前的热身；用户可通过更新DeepSeek App或访问官方网页端，以“询问模型身份”的方式验证是否触发灰度——若回复提及“1M上下文+2025年5月知识截止”，即已解锁新版功能。

四、行业影响：春节前的技术竞速，开源与实用并重

此次三家企业同日发力，凸显国产AI赛道“技术迭代加速、竞争白热化”的格局：

GLM5以开源姿态树立行业标杆，推动“智能体工程”落地，开发者已基于其打造出Web App、数字平行世界等多样应用；

MiniMax M2.5持续深耕编程场景，内测阶段便引发行业期待；

DeepSeek则聚焦用户核心需求，以长上下文能力优化实用体验。三者共同构成国产大模型“开源突破+垂直深耕+体验升级”的多元发展态势，为春节后的行业竞争奠定基础。

好文章，需要你的鼓励