GitHub用每日审计将Agent Token成本降低62% | Toolin AI

提交AI工具提交

如果你的团队在 CI 环境中运行 LLM Agent（定时自动化任务），Token 成本可能在不知不觉中累积到惊人的数字。GitHub 工程团队分享了一套"审计-优化"闭环方法，把 Agent 工作流的等效 Token 成本最高降低了 62%。相关工具已集成在 gh-aw CLI 中，你可以直接借鉴这套思路。

等效Token（ET）：跨模型成本比较指标

不同模型的价格差异很大，直接比较 Token 数量没有意义。GitHub 设计了一个"等效 Token（ET）"指标：

输出 Token 按 4 倍权重计算（输出比输入贵得多）
缓存读取 Token 按 0.1 倍权重计算
按模型类型应用系数：Haiku 0.25x、Sonnet 1.0x、Opus 5.0x

这样无论用哪种模型，ET 下降 10% 都对应着约 10% 的成本下降。

审计-优化闭环：两个Agent自动运转

第一步：每日 Token 使用审计器

这个 Agent 每天自动运行，做三件事：

按工作流汇总资源消耗：把所有 Agent 调用通过 API 代理统一转发，每次运行生成 token-usage.jsonl 文件
标记异常运行：发现消耗突然飙升的任务
找出成本最高的任务：按优先级排列，标记需要优化的工作流

第二步：每日 Token 优化器

当审计器发现某个工作流值得关注时，优化器自动启动：

读取相关源码和近期日志
分析低效来源
自动创建 GitHub Issue，提出具体优化建议

两个 Agent 本身的 Token 消耗也被纳入同一份日报统计。

最大收益来源：精简MCP工具

优化器发现的最常见低效来源是未被使用的 MCP 工具。

原因在于：LLM API 本质上是无状态的，每次请求都需要携带工具 Schema。一个包含 40 个工具的 GitHub MCP Server，每轮交互可能额外增加 10KB-15KB 的 Schema 内容。

具体优化动作：

删除未使用的工具定义：在冒烟测试工作流中，仅此一项就让每次调用的上下文减少约 8KB-12KB
用 gh CLI 替代 MCP 调用：获取 PR Diff 和文件内容改为直接用命令行获取，数据在 Agent 启动前预下载到工作目录
避免暴露认证 Token：通过透明 HTTP 代理在运行时获取数据

实测效果

十多个生产环境工作流的优化结果：

工作流	ET 降幅
Auto-Triage Issues	62%（109次运行持续验证）
Security Guard	43%
Smoke Claude	59%
每日社区归因	37%

注意事项

MCP 精简策略有局限性。GitHub 自己的"每日社区归因"工作流虽然移除了 8 个未使用的工具，ET 也没有明显下降。原因是在那个工作流中，工具清单只占整体上下文的一小部分。需要先 profile 确认瓶颈再下手。

你可以直接用的工具

Auditor 和 Optimiser 已作为 gh-aw CLI 的组成部分提供。你可以：

在自己的 CI 中部署类似的 token-usage.jsonl 记录机制
利用 Anthropic 和 OpenAI 的 Prompt 缓存功能
用 LangChain 的 Callback 机制追踪 Agent Token 使用

核心理念：最便宜的一次 LLM 调用，就是根本不发生的那一次调用。

原文参考：GitHub Slashes Agent Workflow Token Spend up to 62% with Daily Audits and MCP Pruning - InfoQ