toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具1,273个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

GitHub用每日审计将Agent Token成本降低62%

2026/06/05
·toolin小编

GitHub推出gh-aw CLI工具,通过每日Token审计与MCP精简构建审计-优化闭环,Auto-Triage任务持续降低62%的等效Token成本。

GitHub用每日审计将Agent Token成本降低62%
GitHub用每日审计将Agent Token成本降低62%
2026/06/05

GitHub用每日审计将Agent Token成本降低62%

GitHub推出gh-aw CLI工具,通过每日Token审计与MCP精简构建审计-优化闭环,Auto-Triage任务持续降低62%的等效Token成本。

等效Token(ET):跨模型成本比较指标审计-优化闭环:两个Agent自动运转第一步:每日 Token 使用审计器第二步:每日 Token 优化器最大收益来源:精简MCP工具实测效果注意事项你可以直接用的工具
AI教程

如果你的团队在 CI 环境中运行 LLM Agent(定时自动化任务),Token 成本可能在不知不觉中累积到惊人的数字。GitHub 工程团队分享了一套"审计-优化"闭环方法,把 Agent 工作流的等效 Token 成本最高降低了 62%。相关工具已集成在 gh-aw CLI 中,你可以直接借鉴这套思路。

等效Token(ET):跨模型成本比较指标

不同模型的价格差异很大,直接比较 Token 数量没有意义。GitHub 设计了一个"等效 Token(ET)"指标:

  • 输出 Token 按 4 倍权重计算(输出比输入贵得多)
  • 缓存读取 Token 按 0.1 倍权重计算
  • 按模型类型应用系数:Haiku 0.25x、Sonnet 1.0x、Opus 5.0x

这样无论用哪种模型,ET 下降 10% 都对应着约 10% 的成本下降。

审计-优化闭环:两个Agent自动运转

第一步:每日 Token 使用审计器

这个 Agent 每天自动运行,做三件事:

  1. 按工作流汇总资源消耗:把所有 Agent 调用通过 API 代理统一转发,每次运行生成 token-usage.jsonl 文件
  2. 标记异常运行:发现消耗突然飙升的任务
  3. 找出成本最高的任务:按优先级排列,标记需要优化的工作流

第二步:每日 Token 优化器

当审计器发现某个工作流值得关注时,优化器自动启动:

  1. 读取相关源码和近期日志
  2. 分析低效来源
  3. 自动创建 GitHub Issue,提出具体优化建议

两个 Agent 本身的 Token 消耗也被纳入同一份日报统计。

最大收益来源:精简MCP工具

优化器发现的最常见低效来源是未被使用的 MCP 工具。

原因在于:LLM API 本质上是无状态的,每次请求都需要携带工具 Schema。一个包含 40 个工具的 GitHub MCP Server,每轮交互可能额外增加 10KB-15KB 的 Schema 内容。

具体优化动作:

  • 删除未使用的工具定义:在冒烟测试工作流中,仅此一项就让每次调用的上下文减少约 8KB-12KB
  • 用 gh CLI 替代 MCP 调用:获取 PR Diff 和文件内容改为直接用命令行获取,数据在 Agent 启动前预下载到工作目录
  • 避免暴露认证 Token:通过透明 HTTP 代理在运行时获取数据

实测效果

十多个生产环境工作流的优化结果:

工作流ET 降幅
Auto-Triage Issues62%(109次运行持续验证)
Security Guard43%
Smoke Claude59%
每日社区归因37%

注意事项

MCP 精简策略有局限性。GitHub 自己的"每日社区归因"工作流虽然移除了 8 个未使用的工具,ET 也没有明显下降。原因是在那个工作流中,工具清单只占整体上下文的一小部分。需要先 profile 确认瓶颈再下手。

你可以直接用的工具

Auditor 和 Optimiser 已作为 gh-aw CLI 的组成部分提供。你可以:

  1. 在自己的 CI 中部署类似的 token-usage.jsonl 记录机制
  2. 利用 Anthropic 和 OpenAI 的 Prompt 缓存功能
  3. 用 LangChain 的 Callback 机制追踪 Agent Token 使用

核心理念:最便宜的一次 LLM 调用,就是根本不发生的那一次调用。

原文参考:GitHub Slashes Agent Workflow Token Spend up to 62% with Daily Audits and MCP Pruning - InfoQ

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI教程
等效Token(ET):跨模型成本比较指标审计-优化闭环:两个Agent自动运转第一步:每日 Token 使用审计器第二步:每日 Token 优化器最大收益来源:精简MCP工具实测效果注意事项你可以直接用的工具

相关文章

Claude Fable 5:Anthropic最强模型实测指南
AI产品

Claude Fable 5:Anthropic最强模型实测指南

Anthropic发布Claude Fable 5与Mythos 5双版本,SWE-bench Pro得分80.3%,API定价输入$10/百万Token,限时免费至6月22日。

avatar for toolin小编
toolin小编
1天前
在Codex里同时跑Claude Code的设置方法
AI教程

在Codex里同时跑Claude Code的设置方法

一招搞定Codex和Claude Code双持:左边GPT规划,右边Claude干活,互为fallback,两家的拒答边界互不干扰。

avatar for toolin小编
toolin小编
1天前
谷歌Gemini实时翻译:70+语言边听边译
AI产品

谷歌Gemini实时翻译:70+语言边听边译

Google发布Gemini 3.5 Live Translate,实现70+语言实时语音互译,保留语速语调,延迟仅几秒,已全球上线Google Translate和Meet。

avatar for toolin小编
toolin小编
1天前