Claude 顾问策略实操：Opus当军师，Sonnet干苦力

做 AI Agent 的开发者都面临一个两难：用 Opus 聪明但贵，用 Sonnet 便宜但关键时刻掉链子。Anthropic 最新推出的「顾问策略」（Advisor Strategy）和 Monitor 工具，把这个难题变成了一个 API 参数的事。

这篇文章带你实操这两个功能，从 API 调用到成本计算，一步不落。

顾问策略是什么

传统做法是让最强模型当「编排者」，把大任务拆成子任务分给小模型。问题在于，无论任务简单还是复杂，每条请求开头都要烧掉最贵的 Token。

顾问策略反过来了：让 Sonnet/Haiku 当执行者冲在前面，只有遇到难题时才向 Opus 请教。Opus 不直接和人对话，也不调用工具，只负责看上下文、给建议。

实测数据：

组合方案	SWE-bench 得分变化	成本变化
Sonnet 4.6 + Opus 顾问	+2.7%	-11.9%
Haiku 4.5 + Opus 顾问	性能翻倍	成本仅 $1.07（vs Sonnet $7）
Haiku 4.5 + Opus (BrowseComp)	19.7% -> 41.2%	成本降低85%

一行代码启用顾问策略

在 Messages API 请求中声明 advisor_20260301 即可。模型的交接在单次 /v1/messages 请求内部静默完成，不需要额外回传数据或管理上下文。

response = client.messages.create(
    model="claude-sonnet-4-6",  # 执行者
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",  # 顾问
            "max_uses": 3,  # 最多请 Opus 出手 3 次
        },
        # ... 你的其他工具
    ],
    messages=[...]
)
# 顾问消耗的 Token 会在 usage 中单独列出

关键参数说明：

model: 指定执行者模型（Sonnet 或 Haiku）
advisor_20260301: 顾问工具类型，固定值
advisor.model: 指定顾问模型（通常选 Opus）
max_uses: 限制单次请求中顾问最大调用次数，防止 Token 超支

Token 费用怎么算

顾问消耗的 Token 按 Opus 定价，执行者消耗的 Token 按 Sonnet 或 Haiku 定价。

关键在于，顾问每次出手只生成一份简短的计划，通常 400 到 700 个 Token。而真正的大头输出，全部由执行者以更低的费率包揽。

三种组合的适用场景：

Haiku + Opus 顾问：高并发、预算敏感场景，成本最低
Sonnet + Opus 顾问：平衡性能和成本的日常选择
Opus + Opus 顾问：最高质量，适合关键任务

提示: 用 max_uses 控制顾问调用次数。顾问的 Token 消耗在 usage 信息中单独列出，方便追踪每一层模型的开销。

Monitor 工具：从轮询到事件驱动

同一天，Anthropic 还推出了 Monitor 工具。它解决的是另一个烧钱问题：Agent 空转。

过去让 Agent 监控某个任务（比如等 CI 跑完），它必须不停循环询问，每问一次就烧一轮 Token。Monitor 让 Claude 自己写一段后台监控代码，从「主动轮询」变成「事件驱动」。

典型用法：

持续监控系统日志中的错误，有问题了才叫 Agent 处理
自动追踪 GitHub 上的 PR 状态，脚本在后台轮询，Agent 不消耗 Token
等待外部事件（邮件到达、部署完成）后唤醒 Agent

Monitor 和顾问策略的逻辑一脉相承：找到「不需要烧钱的环节」，把它剥离出去。一个省模型调用的钱，一个省空转循环的钱。

实际接入步骤

第一步：确认 API 权限

确保你的 Anthropic API 账户已开通，且有足够的 Token 额度。顾问策略目前已在 Claude 平台上线测试版。

第二步：修改现有 API 调用

在你现有的 Agent 代码中，找到 client.messages.create 调用处，添加 advisor 工具配置：

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
            "max_uses": 3,
        },
        # 你现有的工具定义...
    ],
    messages=[
        {"role": "user", "content": "你的任务描述"}
    ]
)

# 检查顾问的使用情况
print(response.usage)

第三步：监控成本

在返回的 usage 对象中，顾问和执行者的 Token 消耗是分开统计的。你可以据此优化 max_uses 参数，在质量和成本之间找到平衡点。

第四步（可选）：配置 Monitor

对于需要长时间监控的场景，在提示词中明确要求 Claude 创建后台监控脚本，替代轮询循环。

常见问题

Q: 顾问策略和普通的模型路由有什么区别？ A: 传统路由需要你写逻辑判断什么时候切换模型。顾问策略让执行者自己决定什么时候「摇人」，所有操作在同一个 API 请求内完成。
Q: max_uses 设多少合适？ A: 简单任务 1-2 次，复杂编程任务 3-5 次。可以先用 3 次试跑，根据 usage 数据调整。
Q: 顾问策略兼容现有工具栈吗？ A: 完全兼容。advisor 就是 Messages API 请求里的一个普通工具条目，你的 Agent 可以一边搜索网页、执行代码，一边向 Opus 请教。

参考链接

Anthropic 官方博客：https://claude.com/blog/claude-managed-agents
Advisor Strategy API 文档：https://platform.claude.com/docs

这篇文章带你实操这两个功能，从 API 调用到成本计算，一步不落。

顾问策略是什么

传统做法是让最强模型当「编排者」，把大任务拆成子任务分给小模型。问题在于，无论任务简单还是复杂，每条请求开头都要烧掉最贵的 Token。

顾问策略反过来了：让 Sonnet/Haiku 当执行者冲在前面，只有遇到难题时才向 Opus 请教。Opus 不直接和人对话，也不调用工具，只负责看上下文、给建议。

实测数据：

组合方案	SWE-bench 得分变化	成本变化
Sonnet 4.6 + Opus 顾问	+2.7%	-11.9%
Haiku 4.5 + Opus 顾问	性能翻倍	成本仅 $1.07（vs Sonnet $7）
Haiku 4.5 + Opus (BrowseComp)	19.7% -> 41.2%	成本降低85%

一行代码启用顾问策略

在 Messages API 请求中声明 advisor_20260301 即可。模型的交接在单次 /v1/messages 请求内部静默完成，不需要额外回传数据或管理上下文。

response = client.messages.create(
    model="claude-sonnet-4-6",  # 执行者
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",  # 顾问
            "max_uses": 3,  # 最多请 Opus 出手 3 次
        },
        # ... 你的其他工具
    ],
    messages=[...]
)
# 顾问消耗的 Token 会在 usage 中单独列出

关键参数说明：

model: 指定执行者模型（Sonnet 或 Haiku）
advisor_20260301: 顾问工具类型，固定值
advisor.model: 指定顾问模型（通常选 Opus）
max_uses: 限制单次请求中顾问最大调用次数，防止 Token 超支

Token 费用怎么算

顾问消耗的 Token 按 Opus 定价，执行者消耗的 Token 按 Sonnet 或 Haiku 定价。

关键在于，顾问每次出手只生成一份简短的计划，通常 400 到 700 个 Token。而真正的大头输出，全部由执行者以更低的费率包揽。

三种组合的适用场景：

Haiku + Opus 顾问：高并发、预算敏感场景，成本最低
Sonnet + Opus 顾问：平衡性能和成本的日常选择
Opus + Opus 顾问：最高质量，适合关键任务

提示: 用 max_uses 控制顾问调用次数。顾问的 Token 消耗在 usage 信息中单独列出，方便追踪每一层模型的开销。

Monitor 工具：从轮询到事件驱动

同一天，Anthropic 还推出了 Monitor 工具。它解决的是另一个烧钱问题：Agent 空转。

典型用法：

持续监控系统日志中的错误，有问题了才叫 Agent 处理
自动追踪 GitHub 上的 PR 状态，脚本在后台轮询，Agent 不消耗 Token
等待外部事件（邮件到达、部署完成）后唤醒 Agent

Monitor 和顾问策略的逻辑一脉相承：找到「不需要烧钱的环节」，把它剥离出去。一个省模型调用的钱，一个省空转循环的钱。

实际接入步骤

第一步：确认 API 权限

确保你的 Anthropic API 账户已开通，且有足够的 Token 额度。顾问策略目前已在 Claude 平台上线测试版。

第二步：修改现有 API 调用

在你现有的 Agent 代码中，找到 client.messages.create 调用处，添加 advisor 工具配置：

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
            "max_uses": 3,
        },
        # 你现有的工具定义...
    ],
    messages=[
        {"role": "user", "content": "你的任务描述"}
    ]
)

# 检查顾问的使用情况
print(response.usage)

第三步：监控成本

在返回的 usage 对象中，顾问和执行者的 Token 消耗是分开统计的。你可以据此优化 max_uses 参数，在质量和成本之间找到平衡点。

第四步（可选）：配置 Monitor

对于需要长时间监控的场景，在提示词中明确要求 Claude 创建后台监控脚本，替代轮询循环。

常见问题

Q: 顾问策略和普通的模型路由有什么区别？ A: 传统路由需要你写逻辑判断什么时候切换模型。顾问策略让执行者自己决定什么时候「摇人」，所有操作在同一个 API 请求内完成。
Q: max_uses 设多少合适？ A: 简单任务 1-2 次，复杂编程任务 3-5 次。可以先用 3 次试跑，根据 usage 数据调整。
Q: 顾问策略兼容现有工具栈吗？ A: 完全兼容。advisor 就是 Messages API 请求里的一个普通工具条目，你的 Agent 可以一边搜索网页、执行代码，一边向 Opus 请教。

参考链接

Anthropic 官方博客：https://claude.com/blog/claude-managed-agents
Advisor Strategy API 文档：https://platform.claude.com/docs

全部

AI教程

AI产品

AI资源

Claude 顾问策略实操：Opus当军师，Sonnet干苦力

Claude 顾问策略实操：Opus当军师，Sonnet干苦力

作者

分类

相关文章

MCP 推出企业统一授权：一次登录，所有连接器自动就绪

登顶 HF 榜首的 MemSlides：会记住你偏好的 PPT Agent

MobileForge 实操：让 GUI Agent 跑起无标注数据飞轮

Claude 顾问策略实操：Opus当军师，Sonnet干苦力

Claude 顾问策略实操：Opus当军师，Sonnet干苦力

作者

分类

相关文章

MCP 推出企业统一授权：一次登录，所有连接器自动就绪

登顶 HF 榜首的 MemSlides：会记住你偏好的 PPT Agent

MobileForge 实操：让 GUI Agent 跑起无标注数据飞轮