小米发布MiMo-V2-Flash:代码能力全球开源最强的大模型!
2025-12-18 13:30
173
小米12月16日发布Xiaomi MiMo-V2-Flash开源MoE模型,总参数量309B,活跃参数量15B,专为智能体AI设计,专注于快。
该模型专为推理、编码和Agent场景构建,支持混合思维模式,允许用户切换模型是“思考”还是即时回答。它能一键生成功能齐全的HTML网页,并与Claude Code、Cursor和Cline等氛围编码框架协同。该模型提供256k上下文窗口,能够完成数百轮Agent交互和工具调用的任务。

小米官方介绍称,这是一个专为极致推理效率自研的总参数309B(激活15B)的MoE模型,通过Hybrid注意力架构创新及多层MTP推理加速,在多个Agent测评基准上保持进入全球开源模型Top 2;代码能力超过所有开源模型,比肩标杆闭源模型Claude 4.5 Sonnet,但推理成本仅为其2.5%,生成速度提升2倍。
Xiaomi MiMo-V2-Flash采用1:5的Global Attention与Sliding Window Attention(SWA)混合结构,128窗口大小,原生32K外扩256K训练。
小米推出了一个在线AI聊天服务Xiaomi MiMO Studio,用户可以在其中体验Xiaomi MiMo-V2-Flash。该服务支持深度思考和联网搜索。
Xiaomi MiMo-V2-Flash的模型权重和推理代码均采用MIT协议全面开源。MiMo-V2-Flash的API定价为输入0.3/M tokens,API限时免费。
MiMo-V2-Flash围绕极致推理效率设计了模型结构,通过3层MTP推理加速并行Token验证,实现了2.0~2.6倍的推理速度提升。
MiMo-V2-Flash凭借总参数309B(激活15B),实现了代码和Agent评测基准上全球开源模型Top2,且初步具备模拟世界的能力,可通过HTML写操作系统、模拟太阳系、画一棵圣诞树等。
0
好文章,需要你的鼓励
