阶跃星辰（StepFun）发布Step 3.5 Flash，定位为“为Agent而生”的高效推理引擎

2026-02-02 18:02

239

2月2日，阶跃星辰（StepFun）正式发布并开源其迄今最强基础模型——Step 3.5 Flash。该模型专为实时智能体（Agent）工作流场景优化，被定位为“为Agent而生”的高效推理引擎，在推理速度、复杂任务稳定性和成本控制上实现显著突破。

Step 3.5 Flash 采用稀疏混合专家（Sparse MoE）架构，总参数规模达1960亿（196B），但每个token仅激活约110亿参数，这种极高的“智能密度”使其在保持前沿推理能力的同时，显著降低计算开销。

推理速度：在单请求代码类任务中，最高可达350 token/s，远超多数同级别开源模型，特别适合需要低延迟的实时Agent交互场景。

上下文窗口：支持256K长上下文，结合高效推理设计，能稳定处理长链条、多步复杂任务。

基准表现：官方数据显示，该模型在数学推理（AIME 2025等）和Agent能力评测上已逼近甚至部分超越部分头部闭源模型，同时在多个编码和Agent基准上优于GLM-4.7、DeepSeek v3.2等竞品。

额外优化：引入MTP-3（Multi-Token Prediction）技术，可单次预测多个token，进一步提升生成效率。

生态适配与开源落地发布当天，华为昇腾、沐曦股份（曦云C600）、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家国产AI芯片头部厂商已完成Day 0级适配。通过模型与国产算力的深度联合优化，有效降低推理成本，推动大模型在企业级和开发者场景的快速落地。阶跃星辰此前联合近10家芯片及基础设施厂商发起“模芯生态创新联盟”，此次适配被视为联盟成果的集中体现，标志着中国AI基础设施正加速从“模型驱动”向“模型+算力协同”转型。模型已全量开源并上线：

Hugging Face：https://huggingface.co/stepfun-ai/Step-3.5-Flash

GitHub：https://github.com/stepfun-ai/Step-3.5-Flash

同时支持OpenRouter、阶跃星辰官方平台免费试用，以及NVIDIA平台部署。

战略背景与未来展望

此次发布是印奇（旷视联合创始人）出任阶跃星辰董事长、公司完成超50亿元B+轮融资（中国大模型赛道过去一年单笔最高）后的首个重磅动作，显示出公司在开源路线与Agent方向的全面押注。官方同时宣布Step 4模型训练已正式启动，并公开邀请全球开发者共同参与下一代Agent基础模型的定义与共创。

业内分析认为，随着推理型模型逐渐成为主流，Step 3.5 Flash 以“更快、更强、更稳”的定位，或将进一步加剧开源社区与闭源厂商在Agent时代的竞争格局，同时为国产AI芯片提供更具商业价值的生态验证样本。

好文章，需要你的鼓励