小米发布MiMo-V2-Flash:代码能力全球开源最强的大模型！

2025-12-18 13:30

173

小米12月16日发布Xiaomi MiMo-V2-Flash开源MoE模型，总参数量309B，活跃参数量15B，专为智能体AI设计，专注于快。

该模型专为推理、编码和Agent场景构建，支持混合思维模式，允许用户切换模型是“思考”还是即时回答。它能一键生成功能齐全的HTML网页，并与Claude Code、Cursor和Cline等氛围编码框架协同。该模型提供256k上下文窗口，能够完成数百轮Agent交互和工具调用的任务。

小米官方介绍称，这是一个专为极致推理效率自研的总参数309B（激活15B）的MoE模型，通过Hybrid注意力架构创新及多层MTP推理加速，在多个Agent测评基准上保持进入全球开源模型Top 2；代码能力超过所有开源模型，比肩标杆闭源模型Claude 4.5 Sonnet，但推理成本仅为其2.5%，生成速度提升2倍。

Xiaomi MiMo-V2-Flash采用1:5的Global Attention与Sliding Window Attention(SWA)混合结构，128窗口大小，原生32K外扩256K训练。

小米推出了一个在线AI聊天服务Xiaomi MiMO Studio，用户可以在其中体验Xiaomi MiMo-V2-Flash。该服务支持深度思考和联网搜索。

Xiaomi MiMo-V2-Flash的模型权重和推理代码均采用MIT协议全面开源。MiMo-V2-Flash的API定价为输入

0.1 / M t o k e n s ，输出 0.1/M tokens，输出

0.3/M tokens，API限时免费。

MiMo-V2-Flash围绕极致推理效率设计了模型结构，通过3层MTP推理加速并行Token验证，实现了2.0~2.6倍的推理速度提升。

MiMo-V2-Flash凭借总参数309B（激活15B），实现了代码和Agent评测基准上全球开源模型Top2，且初步具备模拟世界的能力，可通过HTML写操作系统、模拟太阳系、画一棵圣诞树等。

好文章，需要你的鼓励