Anthropic 新推出的 Advisor 功能,Sonnet/Haiku 遇到决策难题时自动咨询 Opus,成本降低 12% 且性能提升,一行代码开启


Anthropic 新推出的 Advisor 功能,Sonnet/Haiku 遇到决策难题时自动咨询 Opus,成本降低 12% 且性能提升,一行代码开启
Anthropic 在 Claude API 工具箱里加入了 Advisor 策略。核心思路很简单:让便宜的模型(Sonnet/Haiku)跑全程,遇到拿不准的决策点时,自动咨询最强的模型(Opus),拿到建议后继续干活。整个过程在一次 API 请求中完成。
以往用 AI Agent 的常见困境:全程用 Opus 太贵,全程用 Sonnet 遇到复杂决策容易出错。自己搭模型路由需要写额外工程逻辑,还得处理格式兼容。
Advisor 把这个"穷人版省钱工作流"变成了官方功能,一行代码开启。
用一个类比说清楚:实习生干活,总监指点。
整个过程对用户不可见,你只看到最终结果。

Anthropic 公布的测试结果:
| 组合 | 基准测试 | 表现 |
|---|---|---|
| Sonnet + Opus advisor | SWE-bench Multilingual | 比 Sonnet 单独高 2.7 个百分点,成本降 11.9% |
| Haiku + Opus advisor | BrowseComp | 得分 41.2%,是 Haiku 单独(19.7%)的两倍多 |
| Haiku + Opus advisor | 成本 | 只有 Sonnet 的 15% |
来自实际用户的反馈:

Advisor 能工作的关键是:执行模型必须"知道自己什么时候不行"。
一个差的模型可能自信满满地选了错误方案,根本不会触发 advisor 调用。这时候你以为 Opus 在把控全局,实际上它从来没被叫到过。
这就是为什么目前 advisor 只支持 Sonnet 和 Haiku 作为执行者 -- 这两个模型经过训练,知道什么时候该举手提问。
生态锁定:Advisor 只支持 Claude 家族内部模型。执行者必须是 Sonnet 或 Haiku,顾问必须是 Opus。你不能用 GPT 当顾问,也不能用 Gemini 当执行者。
格式兼容性:Opus 给 Sonnet 的建议用的是 Sonnet 最容易理解和执行的格式。如果跨厂商混搭,执行精准度会打折扣 -- 就像母语者给外语很好的人下指令,大部分没问题,微妙处会有偏差。
性价比权衡:虽然帮你省钱,但花的还是美元。如果你的场景主要用国内模型,DeepSeek 的成本优势依然明显。
开发者社区很早就在做"模型路由":便宜模型处理简单任务,贵模型处理复杂任务。区别在于:
| 维度 | 自建路由 | Advisor |
|---|---|---|
| 模型选择 | 任意组合 | 仅限 Claude 家族 |
| 工程成本 | 需要自己写路由逻辑 | 一行代码开启 |
| 格式兼容 | 跨厂商需要处理 | 官方保证兼容 |
| 灵活性 | 完全自主 | 受限于 Claude 生态 |
如果你已经在用 Claude API 并且追求性价比,Advisor 是最省心的选择。如果你需要跨厂商组合或完全掌控路由逻辑,自建方案更合适。
Advisor 反映了一个更大的趋势:AI 定价从"按固定智能级别付费"转向"按任务复杂度动态分配智能"。你不再需要为简单任务付 100% 的 Opus 价格,系统会根据实际需求自动调节。
对于开发者来说,这意味着在保证质量的前提下,API 调用成本有了实质性的下降空间。

GitHub狂揽4.8万星的AI Agent框架,通过学习循环和四层记忆系统实现越用越强,支持多平台部署和主流大模型

MiniMax Music 2.6 升级发布,新增 Cover 翻唱功能,支持 BPM 和调性精准控制,开源三款 Music Skill 和 MMX-CLI 工具,两行代码让 Agent 获得音乐能力

Anthropic 推出 Claude 顾问策略(Advisor Strategy)和 Monitor 工具,一行代码让 Opus 幕后指挥 Sonnet/Haiku 执行任务,成本降低85%