Hermes Agent通过三大工程优化将启动时间缩短63%,在11项CLI基准测试中以6:5击败Rust编写的OpenAI Codex,GitHub星标突破16万。


Hermes Agent通过三大工程优化将启动时间缩短63%,在11项CLI基准测试中以6:5击败Rust编写的OpenAI Codex,GitHub星标突破16万。
一个纯 Python 写的开源 Agent 框架,在 CLI 基准测试中击败了用 Rust 编写的 OpenAI Codex。这不是噱头,是 6:5 的真实战绩。
Hermes Agent 是目前 GitHub 上增长最快的开源 Agent 框架。2026 年 2 月上线至今仅三个月,星标已突破 16 万,日活 Token 消耗达到 353B,是同类项目的近两倍。
如果你在选型 AI 编程 Agent,Hermes 值得认真考虑。
Hermes 是 NousResearch 开发的开源 Agent 框架,你可以把它理解为开源版的 Claude Code 或 Codex CLI。它能直接在你的终端里运行,读取项目、理解上下文、规划改动、修改代码文件。
它的核心杀手锏是一套闭环学习架构:每次完成复杂任务后,Agent 会自动将解决方案提炼为可复用的 Skill(技能)。下次遇到类似任务,直接调用已有技能,跳过从头推理。官方数据显示,积累 20 个以上自创技能的实例,完成同类任务的速度比全新实例快 40%。
更厉害的是 v0.12 版本引入的自治 Curator,一个后台自动运行的 Agent,会定期评分、修剪、合并你的技能库。Hermes 不仅能学,还能自己管理学到的知识。
优化前,Hermes 对 Codex 的战绩是 5:6。优化后直接反转为 6:5。而这次逆转不是靠换模型、不是靠堆算力,而是靠三个纯工程优化。
原来每次启动都会调用 Bitwarden Secrets Manager API 拉取凭据,一次就是 380 毫秒。而且缓存是纯进程内的,连续执行两次还是要重新拉。
解决方案:加一个 L2 磁盘缓存。缓存文件权限锁死 0600,存放在 /cache/bws_cache.json,默认 TTL 300 秒。访问 token 本身绝不落盘。一刀砍掉 380ms。
hermes_cli.models._PROVIDER_MODELS 是一个包含所有 AI 供应商模型信息的巨型字典,之前在模块加载时就急切导入,吃掉约 55ms。
团队用 PEP 562 的模块级 getattr 实现了懒加载,只在真正访问模型目录时才付出这笔开销。又省了 55ms。
main.py 顶部原本读了两次 config.yaml,一次 yaml.safe_load 用于密钥脱敏,一次完整的 load_config() 只为检查一个布尔值。合并成一次原始加载。省下 17ms。
三刀加起来,启动时间从 701ms 暴降至 258ms,降幅 63%。
这个结果看起来反直觉,但背后的道理其实很直接:在 Agent 赛道上,框架层面的架构决策比语言层面的原始速度更重要。
一次 LLM 调用的延迟动辄几百毫秒甚至数秒。Hermes 优化掉的 443 毫秒已经是框架层能挤出的极限了。真正影响 Agent 体验的是架构设计,而不是解释型还是编译型。
Hermes 联创兼首席科学家 Teknium 的话一针见血:如果迁移到 Rust,"就无法编辑代码,以及实时改进和迭代"。Python 的优势不在于快,而在于活 -- 开发者友好性和迭代速度,就是最大的性能优势。
# GitHub 地址
git clone https://github.com/nousresearch/hermes-agent
# 按照 README 配置 API Key 即可开始使用Hermes 支持多种底层模型,包括 SkyClaw-v1.0、Qwen 系列、Claude、GPT 等。你可以根据自己的预算和需求选择。

阿里Accio Work推出企业版,支持团队内Skills和Agent一键共享与自动更新,解决中小团队Agent协作的痛点问题。

支付宝推出全球首个Token Pay服务、AI钱包、AI付和AI收四大产品,构成全栈AI原生支付体系,已完成3亿笔智能体支付。

龙虾之父Peter开源skill-cleaner,5大核心功能审计优化Agent技能描述,节省Token成本,提升Agent调用准确性,GitHub已开源。