MiniMax M3 正式发布：编程超越 GPT-5.5，百万上下文多模态模型即将开源

2026-06-01 19:48

6 月 1 日，MiniMax 正式推出全新旗舰大模型MiniMax M3。作为国产前沿模型，M3 同时集齐顶尖编程 Agent 能力、百万级超长上下文、原生多模态三大核心优势，也是国内首个、全球唯一具备全套能力的开源模型。

其综合实力在多项权威评测中超越 GPT-5.5、Gemini 3.1 Pro，逼近 Claude Opus 4.7，未来将开放开源权重，支持私有化部署与二次微调。

MiniMax M3 正式发布：编程超越 GPT-5.5，百万上下文多模态模型即将开源

一、自研 MSA 稀疏架构，突破超长上下文瓶颈

为解决传统大模型长上下文计算量大、推理缓慢的痛点，MiniMax M3 底层采用MSA 自研稀疏注意力架构，摒弃传统全注意力机制的固有缺陷。

通过 KV 分块筛选、外层聚合查询等创新设计，精准优化注意力分配，计算效率远超 Flash-Sparse-Attention 等主流开源方案。M3 API 最高支持100 万 token 超长上下文，保底可用 512K token。在百万上下文场景下，单 token 计算量仅为上代模型的 1/20，预填充阶段提速超 9 倍，解码阶段提速超 15 倍，且能力无损对标全注意力模型。高效架构让模型轻松处理超长论文、完整代码仓库、多轮复杂 Agent 任务，实现上下文维度规模化扩展。

二、编程与 Agent 实力拉满，多项评测领跑全球

编程和智能体能力是 MiniMax M3 核心强项，在国际权威榜单中表现亮眼：

SWE-Bench Pro 超越 GPT-5.5 与 Gemini 3.1 Pro；

BrowseComp 智能体评测 83.5 分反超 Opus 4.7；

Claw-Eval 自主 Agent 评测拿下全场最高分。

实战能力更具说服力，M3 可自主耗时 12 小时复现 ICLR 获奖论文，完成代码提交、实验绘图与结论验证；还能从零攻坚 NVIDIA Hopper 架构 FP8 内核优化，24 小时内完成千次工具调用，将硬件利用率从 7.6% 提升至 71.3%，实现 9.4 倍加速。同时模型可自主完成大模型数据合成、训练迭代全流程，综合实力仅次于 Opus 4.7 和 GPT-5.5，领先行业多数模型。

三、原生多模态训练，深度适配全场景应用

MiniMax M3 从训练初始就采用多模态混合训练，重构数据管线将预训练数据扩容至 100 万亿 token，依托交错数据训练模式，实现文本、图像、视频语义深度融合，告别后期补丁式适配。

模型支持图片、视频输入，具备电脑桌面远程操作能力，可跨应用完成办公自动化任务。

在 OmniDocBench 多模态文档评测中，得分超越 Gemini 3.1 Pro，擅长解析图表、公式与长文档，完美适配学术研究、办公自动化、多媒体内容理解等场景。

四、配套生态完善，高性价比即将开源

MiniMax 同步上线专属 Agent 产品MiniMax Code，依托 M3 能力实现任务拆解、集群协作、自主反思修正，可无人干预连续运行数天，还支持电脑端跨系统自动化操作。

定价方面，M3 推出三档 Token 套餐，同等价格下用量约为 Claude 订阅的 15 倍，支持思考与极速双模式按需切换。官方已确认 M3 即将登陆 GitHub 与 HuggingFace 开源，开放模型权重与技术报告，开发者可自由部署私有集群、定制微调，将为国产 AI 开源生态注入全新活力。

好文章，需要你的鼓励