Step 3.7 Flash：409 tok/s的Agent效率模型

当 Agent 成为主流落地形态，模型竞争的关键不再是"谁更聪明"，而是"谁能在单位成本下把更多任务又快又稳地跑完"。阶跃星辰的 Step 3.7 Flash 就是为这个赛点而生的。

Step 3.7 Flash 是什么

Step 3.7 Flash 是阶跃星辰最新发布的 Agent 效率模型，在 Artificial Analysis（AA 榜）上拿下了多个第一：

在 Agent 场景里，一个任务需要调用几十次模型。每次慢两秒、贵一点，几十次累积下来，延迟和成本都会让你头疼。

Step 3.7 Flash 的定价：每百万输入 token 0.2 美元、输出 token 1.15 美元。单任务成本约为 Claude Opus 4.6 的 1/9，但编程能力做到了它的 97%。

有开发者把 Step 3.7 Flash 和几个主流模型放在一起测，结果 3.7 Flash 跑出了 2123 tok/s，一骑绝尘。在 NVFP4 设置下，极限吞吐甚至顶到了 6000 tok/s。

多模型速度对比

上传一张灵巧手图片，Step 3.7 Flash 能结合外观细节快速确认产品型号，并自动联网搜索全维度参数，整理成结构化表格。

把一文件夹的发票丢给 Step 3.7 Flash（通过 OpenClaw），不到 60 秒就生成了一份报销 Excel 和给财务的说明文档，逐一核对内容无误。

让 Step 3.7 Flash 生成 40 个差异化虚拟用户，对外卖 App 的 5 个新功能做投票排序。40 个 Agent 全部有效返回，没有角色混淆或格式跑偏。最终投票结果清晰，人群分层也合理。

多Agent集群

有开发者统计了 OpenRouter 上 60 多个服务商的 398 个核心数据，整理出"缓存命中率排行榜"。阶跃以 86.1% 排进 S 档、位列全球第二，仅次于 DeepSeek。

缓存命中率高意味着推理系统工程做得好。在 Agent、RAG 等长任务场景里，重复的上下文前缀能被高效复用，直接换来更低成本、更高吞吐。

Step 3.7 Flash 的核心价值不在单轮问答的"聪明程度"，而在于 Agent 工作流中的"完成效率"。如果你的项目需要模型被反复调用、长时间运行，这个模型值得认真评估。

Step 3.7 Flash 是阶跃星辰最新发布的 Agent 效率模型，在 Artificial Analysis（AA 榜）上拿下了多个第一：

在 Agent 场景里，一个任务需要调用几十次模型。每次慢两秒、贵一点，几十次累积下来，延迟和成本都会让你头疼。

Step 3.7 Flash 的定价：每百万输入 token 0.2 美元、输出 token 1.15 美元。单任务成本约为 Claude Opus 4.6 的 1/9，但编程能力做到了它的 97%。

有开发者把 Step 3.7 Flash 和几个主流模型放在一起测，结果 3.7 Flash 跑出了 2123 tok/s，一骑绝尘。在 NVFP4 设置下，极限吞吐甚至顶到了 6000 tok/s。

多模型速度对比