toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具860个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策
2026/04/11

Claude 顾问策略实操:Opus当军师,Sonnet干苦力

Anthropic 推出 Claude 顾问策略(Advisor Strategy)和 Monitor 工具,一行代码让 Opus 幕后指挥 Sonnet/Haiku 执行任务,成本降低85%

做 AI Agent 的开发者都面临一个两难:用 Opus 聪明但贵,用 Sonnet 便宜但关键时刻掉链子。Anthropic 最新推出的「顾问策略」(Advisor Strategy)和 Monitor 工具,把这个难题变成了一个 API 参数的事。

这篇文章带你实操这两个功能,从 API 调用到成本计算,一步不落。

顾问策略是什么

传统做法是让最强模型当「编排者」,把大任务拆成子任务分给小模型。问题在于,无论任务简单还是复杂,每条请求开头都要烧掉最贵的 Token。

顾问策略反过来了:让 Sonnet/Haiku 当执行者冲在前面,只有遇到难题时才向 Opus 请教。Opus 不直接和人对话,也不调用工具,只负责看上下文、给建议。

实测数据:

组合方案SWE-bench 得分变化成本变化
Sonnet 4.6 + Opus 顾问+2.7%-11.9%
Haiku 4.5 + Opus 顾问性能翻倍成本仅 $1.07(vs Sonnet $7)
Haiku 4.5 + Opus (BrowseComp)19.7% -> 41.2%成本降低85%

一行代码启用顾问策略

在 Messages API 请求中声明 advisor_20260301 即可。模型的交接在单次 /v1/messages 请求内部静默完成,不需要额外回传数据或管理上下文。

response = client.messages.create(
    model="claude-sonnet-4-6",  # 执行者
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",  # 顾问
            "max_uses": 3,  # 最多请 Opus 出手 3 次
        },
        # ... 你的其他工具
    ],
    messages=[...]
)
# 顾问消耗的 Token 会在 usage 中单独列出

关键参数说明:

  • model: 指定执行者模型(Sonnet 或 Haiku)
  • advisor_20260301: 顾问工具类型,固定值
  • advisor.model: 指定顾问模型(通常选 Opus)
  • max_uses: 限制单次请求中顾问最大调用次数,防止 Token 超支

Token 费用怎么算

顾问消耗的 Token 按 Opus 定价,执行者消耗的 Token 按 Sonnet 或 Haiku 定价。

关键在于,顾问每次出手只生成一份简短的计划,通常 400 到 700 个 Token。而真正的大头输出,全部由执行者以更低的费率包揽。

三种组合的适用场景:

  • Haiku + Opus 顾问:高并发、预算敏感场景,成本最低
  • Sonnet + Opus 顾问:平衡性能和成本的日常选择
  • Opus + Opus 顾问:最高质量,适合关键任务

提示: 用 max_uses 控制顾问调用次数。顾问的 Token 消耗在 usage 信息中单独列出,方便追踪每一层模型的开销。

Monitor 工具:从轮询到事件驱动

同一天,Anthropic 还推出了 Monitor 工具。它解决的是另一个烧钱问题:Agent 空转。

过去让 Agent 监控某个任务(比如等 CI 跑完),它必须不停循环询问,每问一次就烧一轮 Token。Monitor 让 Claude 自己写一段后台监控代码,从「主动轮询」变成「事件驱动」。

典型用法:

  • 持续监控系统日志中的错误,有问题了才叫 Agent 处理
  • 自动追踪 GitHub 上的 PR 状态,脚本在后台轮询,Agent 不消耗 Token
  • 等待外部事件(邮件到达、部署完成)后唤醒 Agent

Monitor 和顾问策略的逻辑一脉相承:找到「不需要烧钱的环节」,把它剥离出去。一个省模型调用的钱,一个省空转循环的钱。

实际接入步骤

第一步:确认 API 权限

确保你的 Anthropic API 账户已开通,且有足够的 Token 额度。顾问策略目前已在 Claude 平台上线测试版。

第二步:修改现有 API 调用

在你现有的 Agent 代码中,找到 client.messages.create 调用处,添加 advisor 工具配置:

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=4096,
    tools=[
        {
            "type": "advisor_20260301",
            "name": "advisor",
            "model": "claude-opus-4-6",
            "max_uses": 3,
        },
        # 你现有的工具定义...
    ],
    messages=[
        {"role": "user", "content": "你的任务描述"}
    ]
)

# 检查顾问的使用情况
print(response.usage)

第三步:监控成本

在返回的 usage 对象中,顾问和执行者的 Token 消耗是分开统计的。你可以据此优化 max_uses 参数,在质量和成本之间找到平衡点。

第四步(可选):配置 Monitor

对于需要长时间监控的场景,在提示词中明确要求 Claude 创建后台监控脚本,替代轮询循环。

常见问题

  • Q: 顾问策略和普通的模型路由有什么区别? A: 传统路由需要你写逻辑判断什么时候切换模型。顾问策略让执行者自己决定什么时候「摇人」,所有操作在同一个 API 请求内完成。

  • Q: max_uses 设多少合适? A: 简单任务 1-2 次,复杂编程任务 3-5 次。可以先用 3 次试跑,根据 usage 数据调整。

  • Q: 顾问策略兼容现有工具栈吗? A: 完全兼容。advisor 就是 Messages API 请求里的一个普通工具条目,你的 Agent 可以一边搜索网页、执行代码,一边向 Opus 请教。

参考链接

  • Anthropic 官方博客:https://claude.com/blog/claude-managed-agents
  • Advisor Strategy API 文档:https://platform.claude.com/docs
所有文章

作者

avatar for toolin小编
toolin小编

分类

    顾问策略是什么一行代码启用顾问策略Token 费用怎么算Monitor 工具:从轮询到事件驱动实际接入步骤第一步:确认 API 权限第二步:修改现有 API 调用第三步:监控成本第四步(可选):配置 Monitor常见问题参考链接

    相关文章

    三步把 Gemma 4 接入 OpenClaw,零 Token 成本跑本地 Agent

    三步把 Gemma 4 接入 OpenClaw,零 Token 成本跑本地 Agent

    谷歌官方发布 Gemma 4 + OpenClaw 三步接入教程,通过 Ollama 本地部署,推荐 26B A4B 版本,Mac Studio M4 Pro 48GB 即可运行,不再花钱买 Token

    avatar for toolin小编
    toolin小编
    5小时前
    Codepilot保姆级入门:开源全平台Agent客户端
    AI教程

    Codepilot保姆级入门:开源全平台Agent客户端

    开源Agent客户端Codepilot支持Claude、OpenAI、国产模型Codeplan,提供Skills/MCP/IM远程连接/生成式UI等完整功能,附详细安装配置教程

    avatar for toolin小编
    toolin小编
    2天前
    wechat-cli:用命令行管理微信聊天记录
    AI产品

    wechat-cli:用命令行管理微信聊天记录

    开源微信命令行工具wechat-cli,支持11个命令操作本地微信数据,可导出聊天记录、搜索消息、统计分析,专为AI Agent集成设计。

    avatar for toolin小编
    toolin小编
    2天前