阶跃开源Flash模型实测接入Claude Code,用复杂Agent工作流验证国产模型能否顶上闭源基座


阶跃开源Flash模型实测接入Claude Code,用复杂Agent工作流验证国产模型能否顶上闭源基座
阶跃星辰开源了 Step 3.7 Flash,Apache 2.0 协议,主打"agent 效率"——在真实工作流里又快又稳地把整条链路跑完。官方文档明确列出它能直接接入 Claude Code、Cline、Roo Code 等主流 agent 工具。这篇文章记录了一次完整的实测:把 Step 3.7 Flash 作为底模驱动 Claude Code,跑两个高复杂度的 agent 工作流,看它到底行不行。
Step 3.7 Flash 是阶跃星辰 2025 年 5 月底发布并开源的 Flash 模型:

在 SWE-Bench、ClawEval 等 agent 类基准上,它拿到的是同体量里相当能打的成绩。真正的卖点不是分数最高,是用更小的激活参数、更快的速度,把这个水平稳定交付出来。
阶跃官方文档列出了它支持的工具列表:

step-3.7-flash 接入 Claude Codestepfun 命令,启动 Step 3.7 Flash 驱动的 Claude Code# 参考配置示意(具体参数以阶跃官方文档为准)
# 在 Claude Code 的模型配置中添加 step-3.7-flash 路由
# 具体接入方式参考阶跃官网的 harness 文档
提示:阶跃官网把每个工具(Claude Code、Cline 等)的接入方式都写了详细说明。如果不想自己配,可以试着把接入文档丢给任何一个国产电脑端 agent,让它帮你配。
任务目标:蒸馏一个 AI 领域的投资视角 Skill。
执行过程:

任务目标:用达尔文 2.0 优化一个脱口秀 Skill。
执行过程:

按阶跃控制台定价:
属于 Flash 级别的定价,适合高频调用的 agent 工作流。
实测中 Step 3.7 Flash 展现出两个关键特质:
它不是完美无瑕的——中间有少量编辑操作报错(更多是本地工具环境的问题),模型退回去换个方式重试就过了。但作为一个开源 Flash 模型,在复杂 agent 工作流中表现出和订阅版 Claude Code 类似的执行效果,已经超出了预期。
如果你在用 Claude Code、Codex 这类工具,但对成本有顾虑,一个能接进现有工作流、开源、又能把整条链路稳稳跑完的模型,确实值得一试。