阶跃星辰StepFun开源激活参数只有11B的Step-3.5-Flash模型,但是评测结果和Kimi K2.5、Qwen3-Max-Thinking差不多,最高推理速度可以达到350tokens/s!

Stepfun AI(阶跃星辰)正式发布了其最新开源基础模型StepFun-Flash-3.5。这款模型以“快速、锐利、可靠的 agentic 智能”为核心设计,采用稀疏混合专家(Sparse MoE)架构,总参数量 196B,但每 token 仅激活 11B 参数,实现高效推理的同时保持前沿级性能。它支持 256K 超长上下文、多 token 并行预测(MTP-3),推理速度可达 100-300 token/s,甚至在编码任务中峰值 350 token/s。


作为一款专为智能体(Agent)场景优化的开源模型,StepFun-Flash-3.5 一发布便在多个 agentic 和编码基准上表现出色,有很多人测试反馈速度非常出色,性能表现也很亮眼。

对比当前国内另外两个刚发布不久的最强模型Moonshot Kimi K2.5(以下简称 Kimi K2.5)和阿里通义 Qwen3-Max-ThinkingStepFun-Flash-3.5 在多项任务上接近或超越,但在资源占用和推理速度方面占据绝对优势。

[TOC]

StepFun-Flash-3.5 vs Kimi K2.5 vs Qwen3-Max 模型核心特性对比

先看一下这三个模型的基本参数,参数量方面 StepFun-Flash-3.5 最少,其他 2 个都是万亿参数规模,StepFun-Flash-3.5 只有 1/5,激活参数方面也很少,只有 11B。上下文长度 256K,这一点 Qwen3-Max-Thinking 的 100 万还是有优势的:


StepFun-Flash-3.5 的最大亮点在于高效 agentic 设计:它内置“Think-and-Act”协同、工具调用优化、多代理编排,以及边缘-云协同能力,支持本地部署(INT4 量化后可在消费级硬件运行)。

关于三个模型更多的参数对比参考 DataLearnerAI 的大模型参数对比工具:https://www.datalearner.com/specs-compare/stepfun-flash-3-5/kimi-k2-5/qwen3-max

StepFun-Flash-3.5 vs Kimi K2.5 vs Qwen3-Max 基准性能对比

StepFun-Flash-3.5 官方提供了多维度基准对比,这里我们主要对比前不久刚发布的另外 2 个国产大模型,分别是开源的 Kimi K2.5 和闭源的 Qwen3-Max-Thinking:

数据对比】StepFun-Flash-3.5 vs Kimi-k2.5 vs Qwen3-Max,谁才是 2026 开年的性价比之王?

数据来源:https://www.datalearner.com/benchmark-compare/popular-compare/Stepfun-Flash-3_5-vs-Kimi-k2_5-vs-Qwen3-Max

简单来说,这三个模型的评测结果差距很小:

  • 编码与 agentic 领域StepFun-Flash-3.5 在 SWE-bench Verified 达到 74.4%,仅略低于 Kimi K2.5 的 76.8%,但远高于 Qwen3-Max 的 69.6%。在 Terminal-Bench 2.0 上微弱领先 Kimi,显示出更强的终端操作和长链 agent 能力。同时,在 τ²-Bench 上大幅领先 Kimi Thinking 变体,证明其工具调用和多代理协同更高效。
  • 数学与推理领域StepFun-Flash-3.5 在 AIME、IMOAnswerBench 等高中/国际数学竞赛基准上全面领先 Kimi K2.5,显示出极强的逻辑推理能力(支持 PaCoRe 等增强后接近满分)。
  • 其他 agent 亮点StepFun-Flash-3.5 在 xbench-DeepSearch 等深度研究任务上表现突出,支持多代理循环规划、搜索与合成,适合复杂投资分析、科研等场景。

不过,StepFun-Flash-3.5 的优势很明显:活跃参数仅 11B,推理成本比另外两个低很多。

StepFun-Flash-3.5 总结

其实,最近开源模型发展很快,性能提升也很明显,但是动不动就万亿参数规模或者 DeepSeek 的 6700 多亿参数规模,成本实在是太高。本次 StepFun-Flash-3.5 最大的价值就是参数量适中,评测结果不错,成本很低。如果实测和评测表现相符,那基本上这个模型一定具有非常高的吸引力了。

关于 StepFun-Flash-3.5 更多信息参考 DataLearnerAI 模型信息卡:https://www.datalearner.com/ai-models/pretrained-models/stepfun-flash-3-5

欢迎关注 DataLearner 官方微信,获得最新 AI 技术推送

DataLearner 官方微信二维码