阶跃星辰(StepFun)发布Step 3.5 Flash,定位为“为Agent而生”的高效推理引擎
2026-02-02 18:02
239
2月2日,阶跃星辰(StepFun)正式发布并开源其迄今最强基础模型——Step 3.5 Flash。该模型专为实时智能体(Agent)工作流场景优化,被定位为“为Agent而生”的高效推理引擎,在推理速度、复杂任务稳定性和成本控制上实现显著突破。

Step 3.5 Flash 采用稀疏混合专家(Sparse MoE)架构,总参数规模达1960亿(196B),但每个token仅激活约110亿参数,这种极高的“智能密度”使其在保持前沿推理能力的同时,显著降低计算开销。
- 推理速度:在单请求代码类任务中,最高可达350 token/s,远超多数同级别开源模型,特别适合需要低延迟的实时Agent交互场景。
- 上下文窗口:支持256K长上下文,结合高效推理设计,能稳定处理长链条、多步复杂任务。
- 基准表现:官方数据显示,该模型在数学推理(AIME 2025等)和Agent能力评测上已逼近甚至部分超越部分头部闭源模型,同时在多个编码和Agent基准上优于GLM-4.7、DeepSeek v3.2等竞品。
- 额外优化:引入MTP-3(Multi-Token Prediction)技术,可单次预测多个token,进一步提升生成效率。
生态适配与开源落地发布当天,华为昇腾、沐曦股份(曦云C600)、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家国产AI芯片头部厂商已完成Day 0级适配。通过模型与国产算力的深度联合优化,有效降低推理成本,推动大模型在企业级和开发者场景的快速落地。阶跃星辰此前联合近10家芯片及基础设施厂商发起“模芯生态创新联盟”,此次适配被视为联盟成果的集中体现,标志着中国AI基础设施正加速从“模型驱动”向“模型+算力协同”转型。模型已全量开源并上线:
- Hugging Face:https://huggingface.co/stepfun-ai/Step-3.5-Flash
- 同时支持OpenRouter、阶跃星辰官方平台免费试用,以及NVIDIA平台部署。
战略背景与未来展望
此次发布是印奇(旷视联合创始人)出任阶跃星辰董事长、公司完成超50亿元B+轮融资(中国大模型赛道过去一年单笔最高)后的首个重磅动作,显示出公司在开源路线与Agent方向的全面押注。官方同时宣布Step 4模型训练已正式启动,并公开邀请全球开发者共同参与下一代Agent基础模型的定义与共创。
业内分析认为,随着推理型模型逐渐成为主流,Step 3.5 Flash 以“更快、更强、更稳”的定位,或将进一步加剧开源社区与闭源厂商在Agent时代的竞争格局,同时为国产AI芯片提供更具商业价值的生态验证样本。
0
好文章,需要你的鼓励
