toolin.ai logo
toolin.ai
首页
AI工具
AI技能包
AI资讯
精选推文
AI提示词
提交AI工具提交
toolin.ai logo
toolin.ai

百万AI玩家的创作利器库,发现最佳AI工具组合,提升您的创作效率

AI工具899个
技能包11个
产品功能
  • AI工具
  • AI技能包
  • AI资讯
  • 精选推文
关于我们
  • 关于Toolin
  • 联系我们
  • 合作洽谈
  • 更新日志
关注我们
© 2025 toolin.ai. All rights reserved.
服务条款隐私政策

Hermes Agent:会自我进化的开源AI助手

2026/04/10
·toolin小编

GitHub狂揽4.8万星的AI Agent框架,通过学习循环和四层记忆系统实现越用越强,支持多平台部署和主流大模型

Hermes Agent:会自我进化的开源AI助手
Hermes Agent:会自我进化的开源AI助手
2026/04/10

Hermes Agent:会自我进化的开源AI助手

GitHub狂揽4.8万星的AI Agent框架,通过学习循环和四层记忆系统实现越用越强,支持多平台部署和主流大模型

Hermes Agent 是什么核心功能:三层进化机制1. 记忆层 - 四层记忆系统2. 技能层 - 自动生成与优化3. 训练层 - 数据闭环与 OpenClaw 的区别技术特性多模型支持辅助模型机制多平台支持快速开始安装要求一行命令安装配置建议适用场景局限性总结
AI产品

Hermes Agent 是什么

Hermes Agent 是一个能够从使用中自我进化的 AI Agent 框架。与大多数"用完就忘"的 AI 助手不同,它会记住什么方法有效,并在每次任务后自动提炼经验,生成可复用的技能文件。

由 Nous Research 团队开发,这个开源项目在 GitHub 上已经获得 4.8 万个 Stars,是目前增长最快的 AI Agent 项目之一。它的核心理念是:Agent 不应该只是一次性的调用接口,而应该是私有的、常驻的、会积累的,并且能够反哺训练。

Hermes Agent GitHub 项目

项目地址:https://github.com/nousresearch/hermes-agent

核心功能:三层进化机制

1. 记忆层 - 四层记忆系统

Hermes Agent 的记忆系统分为四个层级,每层负责不同类型的信息存储和调取:

记忆系统架构

  • 第一层:常驻提示记忆(MEMORY.md + USER.md)
    存放每次会话自动加载的核心上下文,限制 3575 字符,强制精简关键信息

  • 第二层:会话归档
    所有对话写入 SQLite 数据库,支持全文检索。需要历史信息时,通过 LLM 摘要只提取相关部分

  • 第三层:技能文件库
    自动生成的可复用操作流程,默认只加载名称和描述,全文按需调入。技能库可从 40 个扩展到 200 个而不增加上下文成本

  • 第四层:用户建模(Honcho)
    跨会话积累你的偏好、沟通风格和领域知识,适合长期使用场景

2. 技能层 - 自动生成与优化

每次任务完成后,如果满足以下任一条件,Hermes 会自动在 ~/.hermes/skills 目录生成技能文件:

  • 工具调用超过 5 次
  • 任务中途出错但自己修复了
  • 用户做过纠正
  • 走了一条不明显但有效的路径

技能生成机制

技能文件包含完整的操作流程:名称、描述、步骤、涉及的工具调用。格式遵循 agentskills.io 开放标准,理论上可跨平台使用(OpenClaw、Claude Code、Cursor 等)。

更重要的是,技能文件不是写死的。当 Hermes 在后续执行中发现更好的路径,会用 patch 方式修改,只更新有问题的部分,而不是整体重写。

3. 训练层 - 数据闭环

Hermes 内置批量轨迹生成能力,接入了 Atropos 强化学习环境。每天执行的任务轨迹可以直接用于训练下一代模型。

学习循环

这意味着:你的日常使用不仅让当前 Agent 变强,还能为未来的模型积累高质量数据。

与 OpenClaw 的区别

维度Hermes AgentOpenClaw
记忆方式四层记忆系统,自动分类和摘要静态配置文件,需手动管理
技能生成任务后自动提炼和优化需手动编写 Skill 文件
学习能力内置学习循环,越用越强每次对话相对独立
数据积累轨迹可用于模型训练无训练反馈机制
上手难度较高,更像基础设施相对简单,快速上手

OpenClaw 适合快速搭建一个能控制各种工具的 AI 助手;Hermes Agent 则适合有重复工作流、需要 Agent 从使用中积累经验的场景。

技术特性

多模型支持

Hermes Agent 支持广泛的推理服务商:

  • Nous Portal(订阅制,零配置)
  • Anthropic(直接用 Claude,支持 API key 或 Claude Code 授权)
  • OpenRouter、DeepSeek、Hugging Face
  • 阿里云 DashScope(Qwen 系列)
  • GitHub Copilot
  • Ollama(本地模型)
  • 小米 MiMo-V2 系列(支持百万 Token 上下文,目前限免两周)

模型配置

辅助模型机制

Hermes 有一个 Auxiliary Models 模块,专门处理不值得占用主模型的高频任务:

  • 图像分析
  • 网页内容提取
  • 技能匹配
  • 记忆处理

这些任务会自动分配给更轻量的模型(如 Gemini Flash),大幅降低成本。

多平台支持

消息平台方面,支持:

  • Telegram(功能最完整)
  • Discord
  • Slack
  • 飞书

支持语音、图片、文件等各种格式,一套网关进程连接所有平台。

平台支持

快速开始

安装要求

  • 支持系统:Linux、macOS、WSL2(Windows 需安装 WSL)、Android(通过 Termux)
  • 自动依赖:Python 3.11、Node.js v22、ripgrep、ffmpeg 等

一行命令安装

curl -sSL https://hermes-agent.nousresearch.com/install.sh | bash

安装完成后,通过命令行与 Hermes 交互。配置你的首选模型后即可开始使用。

配置建议

  1. 首次使用:建议从 Nous Portal 或 Claude 开始,零配置门槛低
  2. 成本优化:配置辅助模型使用 Gemini Flash 处理边缘任务
  3. 长期使用:启用 Honcho 用户建模,积累个性化偏好

适用场景

Hermes Agent 特别适合以下场景:

  • 重复性工作流:数据处理、内容生成、代码审查等需要定期执行的任务
  • 需要经验积累的场景:客户关系管理(CRM)与知识库联动,营销自动化
  • 软件工程项目:代码生成、测试、部署流程
  • 长期个人助理:日程管理、信息整理、项目跟踪

如果你只需要一个快速响应的 AI 助手,OpenClaw 更适合;但如果你期待三个月后的 Agent 和第一天不一样,能从失败中学习、记住经验,Hermes Agent 是更好的选择。

局限性

  • 上手门槛:更像需要运行和维护的基础设施,而非开箱即用的工具
  • 配置复杂度:需要理解记忆层级、技能管理等概念
  • 资源占用:本地运行需要一定的计算资源
  • 安全考量:给 AI 足够权限的同时需要考虑沙箱隔离

总结

Hermes Agent 代表了 AI Agent 的一个新方向:从"用完归零的工具"进化为"能从失败中学习的搭档"。它通过三层机制(记忆、技能、训练)构建了完整的学习闭环,让 AI 助手真正做到越用越强。

对于有长期需求、希望 Agent 能够积累经验和优化工作流的开发者和创作者来说,Hermes Agent 值得投入时间深度使用。

官网:https://hermes-agent.nousresearch.com
GitHub:https://github.com/nousresearch/hermes-agent
文档:https://hermes-agent.nousresearch.com/docs

所有文章

作者

avatar for toolin小编
toolin小编

分类

  • AI产品
Hermes Agent 是什么核心功能:三层进化机制1. 记忆层 - 四层记忆系统2. 技能层 - 自动生成与优化3. 训练层 - 数据闭环与 OpenClaw 的区别技术特性多模型支持辅助模型机制多平台支持快速开始安装要求一行命令安装配置建议适用场景局限性总结

相关文章

三步把 Gemma 4 接入 OpenClaw,零 Token 成本跑本地 Agent

三步把 Gemma 4 接入 OpenClaw,零 Token 成本跑本地 Agent

谷歌官方发布 Gemma 4 + OpenClaw 三步接入教程,通过 Ollama 本地部署,推荐 26B A4B 版本,Mac Studio M4 Pro 48GB 即可运行,不再花钱买 Token

avatar for toolin小编
toolin小编
1天前
JoyAI-Image-Edit:首个融合空间智能的开源图像编辑模型

JoyAI-Image-Edit:首个融合空间智能的开源图像编辑模型

京东开源 24B 参数图像模型,业内首个底层融合空间智能的一体化方案,支持相机控制、物体旋转与空间关系操控

avatar for toolin小编
toolin小编
16小时前
VoxCPM 2:开源2B语音模型,30种语言9种方言
AI产品

VoxCPM 2:开源2B语音模型,30种语言9种方言

面壁智能开源2B语音模型VoxCPM 2,支持30种语言、9种中国方言、声音克隆、音色设计与情绪控制,48kHz CD音质,免费商用。

avatar for toolin小编
toolin小编
3天前