Hermes Agent: 开源Python项目击败OpenAI Codex

一个纯 Python 写的开源 Agent 框架，在 CLI 基准测试中击败了用 Rust 编写的 OpenAI Codex。这不是噱头，是 6:5 的真实战绩。

Hermes Agent 是目前 GitHub 上增长最快的开源 Agent 框架。2026 年 2 月上线至今仅三个月，星标已突破 16 万，日活 Token 消耗达到 353B，是同类项目的近两倍。

如果你在选型 AI 编程 Agent，Hermes 值得认真考虑。

Hermes Agent 是什么

Hermes 是 NousResearch 开发的开源 Agent 框架，你可以把它理解为开源版的 Claude Code 或 Codex CLI。它能直接在你的终端里运行，读取项目、理解上下文、规划改动、修改代码文件。

它的核心杀手锏是一套闭环学习架构：每次完成复杂任务后，Agent 会自动将解决方案提炼为可复用的 Skill（技能）。下次遇到类似任务，直接调用已有技能，跳过从头推理。官方数据显示，积累 20 个以上自创技能的实例，完成同类任务的速度比全新实例快 40%。

更厉害的是 v0.12 版本引入的自治 Curator，一个后台自动运行的 Agent，会定期评分、修剪、合并你的技能库。Hermes 不仅能学，还能自己管理学到的知识。

优化前，Hermes 对 Codex 的战绩是 5:6。优化后直接反转为 6:5。而这次逆转不是靠换模型、不是靠堆算力，而是靠三个纯工程优化。

原来每次启动都会调用 Bitwarden Secrets Manager API 拉取凭据，一次就是 380 毫秒。而且缓存是纯进程内的，连续执行两次还是要重新拉。

解决方案：加一个 L2 磁盘缓存。缓存文件权限锁死 0600，存放在 /cache/bws_cache.json，默认 TTL 300 秒。访问 token 本身绝不落盘。一刀砍掉 380ms。

hermes_cli.models._PROVIDER_MODELS 是一个包含所有 AI 供应商模型信息的巨型字典，之前在模块加载时就急切导入，吃掉约 55ms。

团队用 PEP 562 的模块级 getattr 实现了懒加载，只在真正访问模型目录时才付出这笔开销。又省了 55ms。

main.py 顶部原本读了两次 config.yaml，一次 yaml.safe_load 用于密钥脱敏，一次完整的 load_config() 只为检查一个布尔值。合并成一次原始加载。省下 17ms。

三刀加起来，启动时间从 701ms 暴降至 258ms，降幅 63%。

这个结果看起来反直觉，但背后的道理其实很直接：在 Agent 赛道上，框架层面的架构决策比语言层面的原始速度更重要。

一次 LLM 调用的延迟动辄几百毫秒甚至数秒。Hermes 优化掉的 443 毫秒已经是框架层能挤出的极限了。真正影响 Agent 体验的是架构设计，而不是解释型还是编译型。

Hermes 联创兼首席科学家 Teknium 的话一针见血：如果迁移到 Rust，"就无法编辑代码，以及实时改进和迭代"。Python 的优势不在于快，而在于活 -- 开发者友好性和迭代速度，就是最大的性能优势。

# GitHub 地址
git clone https://github.com/nousresearch/hermes-agent

# 按照 README 配置 API Key 即可开始使用

Hermes 支持多种底层模型，包括 SkyClaw-v1.0、Qwen 系列、Claude、GPT 等。你可以根据自己的预算和需求选择。

一个纯 Python 写的开源 Agent 框架，在 CLI 基准测试中击败了用 Rust 编写的 OpenAI Codex。这不是噱头，是 6:5 的真实战绩。

Hermes Agent 是目前 GitHub 上增长最快的开源 Agent 框架。2026 年 2 月上线至今仅三个月，星标已突破 16 万，日活 Token 消耗达到 353B，是同类项目的近两倍。

如果你在选型 AI 编程 Agent，Hermes 值得认真考虑。

# GitHub 地址
git clone https://github.com/nousresearch/hermes-agent

# 按照 README 配置 API Key 即可开始使用

Hermes 支持多种底层模型，包括 SkyClaw-v1.0、Qwen 系列、Claude、GPT 等。你可以根据自己的预算和需求选择。