Anthropic 推出 Claude 顾问策略(Advisor Strategy)和 Monitor 工具,一行代码让 Opus 幕后指挥 Sonnet/Haiku 执行任务,成本降低85%
做 AI Agent 的开发者都面临一个两难:用 Opus 聪明但贵,用 Sonnet 便宜但关键时刻掉链子。Anthropic 最新推出的「顾问策略」(Advisor Strategy)和 Monitor 工具,把这个难题变成了一个 API 参数的事。
这篇文章带你实操这两个功能,从 API 调用到成本计算,一步不落。
传统做法是让最强模型当「编排者」,把大任务拆成子任务分给小模型。问题在于,无论任务简单还是复杂,每条请求开头都要烧掉最贵的 Token。
顾问策略反过来了:让 Sonnet/Haiku 当执行者冲在前面,只有遇到难题时才向 Opus 请教。Opus 不直接和人对话,也不调用工具,只负责看上下文、给建议。
实测数据:
| 组合方案 | SWE-bench 得分变化 | 成本变化 |
|---|---|---|
| Sonnet 4.6 + Opus 顾问 | +2.7% | -11.9% |
| Haiku 4.5 + Opus 顾问 | 性能翻倍 | 成本仅 $1.07(vs Sonnet $7) |
| Haiku 4.5 + Opus (BrowseComp) | 19.7% -> 41.2% | 成本降低85% |
在 Messages API 请求中声明 advisor_20260301 即可。模型的交接在单次 /v1/messages 请求内部静默完成,不需要额外回传数据或管理上下文。
response = client.messages.create(
model="claude-sonnet-4-6", # 执行者
tools=[
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6", # 顾问
"max_uses": 3, # 最多请 Opus 出手 3 次
},
# ... 你的其他工具
],
messages=[...]
)
# 顾问消耗的 Token 会在 usage 中单独列出关键参数说明:
model: 指定执行者模型(Sonnet 或 Haiku)advisor_20260301: 顾问工具类型,固定值advisor.model: 指定顾问模型(通常选 Opus)max_uses: 限制单次请求中顾问最大调用次数,防止 Token 超支顾问消耗的 Token 按 Opus 定价,执行者消耗的 Token 按 Sonnet 或 Haiku 定价。
关键在于,顾问每次出手只生成一份简短的计划,通常 400 到 700 个 Token。而真正的大头输出,全部由执行者以更低的费率包揽。
三种组合的适用场景:
提示: 用
max_uses控制顾问调用次数。顾问的 Token 消耗在 usage 信息中单独列出,方便追踪每一层模型的开销。
同一天,Anthropic 还推出了 Monitor 工具。它解决的是另一个烧钱问题:Agent 空转。
过去让 Agent 监控某个任务(比如等 CI 跑完),它必须不停循环询问,每问一次就烧一轮 Token。Monitor 让 Claude 自己写一段后台监控代码,从「主动轮询」变成「事件驱动」。
典型用法:
Monitor 和顾问策略的逻辑一脉相承:找到「不需要烧钱的环节」,把它剥离出去。一个省模型调用的钱,一个省空转循环的钱。
确保你的 Anthropic API 账户已开通,且有足够的 Token 额度。顾问策略目前已在 Claude 平台上线测试版。
在你现有的 Agent 代码中,找到 client.messages.create 调用处,添加 advisor 工具配置:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=4096,
tools=[
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
"max_uses": 3,
},
# 你现有的工具定义...
],
messages=[
{"role": "user", "content": "你的任务描述"}
]
)
# 检查顾问的使用情况
print(response.usage)在返回的 usage 对象中,顾问和执行者的 Token 消耗是分开统计的。你可以据此优化 max_uses 参数,在质量和成本之间找到平衡点。
对于需要长时间监控的场景,在提示词中明确要求 Claude 创建后台监控脚本,替代轮询循环。
Q: 顾问策略和普通的模型路由有什么区别? A: 传统路由需要你写逻辑判断什么时候切换模型。顾问策略让执行者自己决定什么时候「摇人」,所有操作在同一个 API 请求内完成。
Q: max_uses 设多少合适? A: 简单任务 1-2 次,复杂编程任务 3-5 次。可以先用 3 次试跑,根据 usage 数据调整。
Q: 顾问策略兼容现有工具栈吗? A: 完全兼容。advisor 就是 Messages API 请求里的一个普通工具条目,你的 Agent 可以一边搜索网页、执行代码,一边向 Opus 请教。
谷歌官方发布 Gemma 4 + OpenClaw 三步接入教程,通过 Ollama 本地部署,推荐 26B A4B 版本,Mac Studio M4 Pro 48GB 即可运行,不再花钱买 Token

开源Agent客户端Codepilot支持Claude、OpenAI、国产模型Codeplan,提供Skills/MCP/IM远程连接/生成式UI等完整功能,附详细安装配置教程

开源微信命令行工具wechat-cli,支持11个命令操作本地微信数据,可导出聊天记录、搜索消息、统计分析,专为AI Agent集成设计。