国产 AI 三巨头同日发力:GLM-5 开源领衔,MiniMax、DeepSeek 同步突袭
2026-02-12 20:49
90
2月11日,国产AI赛道迎来密集发布潮,智谱正式推出GLM5、MiniMax开放M2.5内测、DeepSeek灰度上线百万token上下文版本,三家企业同日亮剑,延续去年DeepSeek R1改写行业格局的竞争态势,为春节前的AI圈注入强劲活力。
一、智谱GLM5:开源标杆,参数与能力双飞跃

此前在OpenRouter平台引发热议的神秘模型“Pony Alpha”,正式官宣为智谱新一代旗舰模型GLM5,其核心亮点集中在参数升级、技术创新与开源生态三大维度:
核心配置翻倍:采用MoE架构,总参数从GLM4.5的3550亿跃升至7440亿,激活参数从320亿提升至400亿,预训练数据量从23T tokens扩容至28.5T tokens,基础能力全面强化。
技术亮点突出:集成DeepSeek的稀疏注意力技术(DSA),在保留长上下文处理能力的同时降低部署成本;创新研发Slime异步强化学习框架,解决大模型强化学习训练效率低的行业痛点,让模型可从长程交互中持续学习。
评测表现亮眼:在多项权威基准测试中斩获佳绩——SWEbench Verified以77.8%的成绩位居开源第一;TerminalBench 2.0得分56.2%,逼近Claude Opus 4.5的59.3%;BrowseComp(浏览器Agent能力)得分75.9%,超越Claude Opus 4.5(67.8%)与Gemini 3 Pro(59.2%);在Vending Bench 2模拟售货机经营测试中,以4432美元账户余额接近Claude Opus 4.5,展现出极强的长期规划与资源管理能力。
开源+多场景可用:遵循MIT协议,在HuggingFace与ModelScope平台开放权重,支持vLLM和SGLang本地部署;提供chat.z.ai免费使用渠道,含Chat(轻量化问答)与Agent(生成Word/PDF/Excel文件)两种模式;开发者可通过bigmodel.cn调用API,兼容Claude Code和OpenClaw,GLM Coding Plan Max用户可直接使用,其他套餐逐步开放。发布后智谱股价暴涨32%,全球开源模型综合排名跃居第四、开源第一。
二、MiniMax M2.5:内测开启,编程能力再进阶

MiniMax同步开放新一代模型M2.5的网页端内测,延续其快速迭代节奏:
迭代背景:前身M2.1于2025年12月发布,以2300亿总参数(激活100亿)主打多语言编程能力,在SWEbench多语言测试中超越Claude Sonnet 4.5且成本更低;M2.5在训练过程中表现持续提升,工程负责人透露“投入算力越多,模型表现越亮眼”,呈现“痛苦而快乐的升级困境”。
使用方式:用户可通过MiniMax官网查询是否获得灰度内测资格,目前已有网友拿到权限并启动与GLM5的对比测试。作为1月9日港交所上市企业,MiniMax此次与智谱撞期发布,延续了两家公司IPO前后密集推新的竞争态势。
三、DeepSeek:闷声升级,百万上下文落地
DeepSeek以低调灰度测试的方式完成重要更新,聚焦长上下文能力突破:
核心升级:上下文窗口从此前V3.2版本的128K跃升至1M(百万)token,相当于可一次性处理《三体》三部曲级别的大体量文本,知识截止日期更新至2025年5月,大幅提升长文本处理与信息检索效率。
现状与展望:目前仍为纯文本模型,暂未支持多模态能力,此次灰度测试被视为V4正式版本发布前的热身;用户可通过更新DeepSeek App或访问官方网页端,以“询问模型身份”的方式验证是否触发灰度——若回复提及“1M上下文+2025年5月知识截止”,即已解锁新版功能。
四、行业影响:春节前的技术竞速,开源与实用并重
此次三家企业同日发力,凸显国产AI赛道“技术迭代加速、竞争白热化”的格局:
GLM5以开源姿态树立行业标杆,推动“智能体工程”落地,开发者已基于其打造出Web App、数字平行世界等多样应用;
MiniMax M2.5持续深耕编程场景,内测阶段便引发行业期待;
DeepSeek则聚焦用户核心需求,以长上下文能力优化实用体验。三者共同构成国产大模型“开源突破+垂直深耕+体验升级”的多元发展态势,为春节后的行业竞争奠定基础。
0
好文章,需要你的鼓励
