GitHub推出gh-aw CLI工具,通过每日Token审计与MCP精简构建审计-优化闭环,Auto-Triage任务持续降低62%的等效Token成本。


GitHub推出gh-aw CLI工具,通过每日Token审计与MCP精简构建审计-优化闭环,Auto-Triage任务持续降低62%的等效Token成本。
如果你的团队在 CI 环境中运行 LLM Agent(定时自动化任务),Token 成本可能在不知不觉中累积到惊人的数字。GitHub 工程团队分享了一套"审计-优化"闭环方法,把 Agent 工作流的等效 Token 成本最高降低了 62%。相关工具已集成在 gh-aw CLI 中,你可以直接借鉴这套思路。
不同模型的价格差异很大,直接比较 Token 数量没有意义。GitHub 设计了一个"等效 Token(ET)"指标:
这样无论用哪种模型,ET 下降 10% 都对应着约 10% 的成本下降。
这个 Agent 每天自动运行,做三件事:
token-usage.jsonl 文件当审计器发现某个工作流值得关注时,优化器自动启动:
两个 Agent 本身的 Token 消耗也被纳入同一份日报统计。
优化器发现的最常见低效来源是未被使用的 MCP 工具。
原因在于:LLM API 本质上是无状态的,每次请求都需要携带工具 Schema。一个包含 40 个工具的 GitHub MCP Server,每轮交互可能额外增加 10KB-15KB 的 Schema 内容。
具体优化动作:
gh CLI 替代 MCP 调用:获取 PR Diff 和文件内容改为直接用命令行获取,数据在 Agent 启动前预下载到工作目录十多个生产环境工作流的优化结果:
| 工作流 | ET 降幅 |
|---|---|
| Auto-Triage Issues | 62%(109次运行持续验证) |
| Security Guard | 43% |
| Smoke Claude | 59% |
| 每日社区归因 | 37% |
MCP 精简策略有局限性。GitHub 自己的"每日社区归因"工作流虽然移除了 8 个未使用的工具,ET 也没有明显下降。原因是在那个工作流中,工具清单只占整体上下文的一小部分。需要先 profile 确认瓶颈再下手。
Auditor 和 Optimiser 已作为 gh-aw CLI 的组成部分提供。你可以:
token-usage.jsonl 记录机制核心理念:最便宜的一次 LLM 调用,就是根本不发生的那一次调用。
原文参考:GitHub Slashes Agent Workflow Token Spend up to 62% with Daily Audits and MCP Pruning - InfoQ

Anthropic发布Claude Fable 5与Mythos 5双版本,SWE-bench Pro得分80.3%,API定价输入$10/百万Token,限时免费至6月22日。

一招搞定Codex和Claude Code双持:左边GPT规划,右边Claude干活,互为fallback,两家的拒答边界互不干扰。

Google发布Gemini 3.5 Live Translate,实现70+语言实时语音互译,保留语速语调,延迟仅几秒,已全球上线Google Translate和Meet。