Hermes Agent 完全指南:安装、Skills 机制、与 OpenClaw 对比 | 理想的彼岸
Hermes Agent 完全指南:安装、Skills 机制、与 OpenClaw 对比 Hermes Agent 和 OpenClaw 的核心差距不是功能多少,而是架构哲学:一个"接入一切",一个"记住一切"。本文深度解析两者的 Skills 机制、记忆架构、成本对比,帮你判断是否值得切换,以及如何并行部署。
AI agent 这个词被说烂了。大多数所谓的 agent 不过是"带工具调用的 ChatGPT"——每次会话结束,经验归零,下次见面还是陌生人。
Hermes Agent 不一样。 它是目前开源 personal AI agent 里唯一真正实现了闭环学习的项目:agent 用完比用前更聪明,而且这个"聪明"是可积累、可复用的。26k star,2026 年 2 月由 Nous Research 发布——这是做 Hermes LLM 系列的同一个团队。
这篇文章给你说清楚:Hermes 凭什么值得认真对待,和 OpenClaw 的本质区别在哪,怎么安装上手,以及你是否应该切换过去。
什么是 Hermes Agent?
Hermes Agent 是 Nous Research 开源的 personal AI agent 框架 ,核心设计围绕一个闭环学习机制:agent 在完成任务后自动提取经验、生成可复用的 Skill 文档,并在后续任务中持续精炼这些 Skills。结果是一个越用越聪明的 agent,而不是每次对话从零开始。
它支持 200+ 个 LLM provider(OpenRouter、Anthropic、OpenAI、本地 Ollama 等),内置 47 个工具、14 种 messaging 平台接入、6 种终端运行后端,并兼容 agentskills.io 开放 Skills 标准。
为什么现有 Agent 框架都在原地踏步
问题的根源是架构假设:大多数 agent 框架把 LLM 当作"执行引擎",把记忆当作"上下文注入"。会话结束,context 清零,经验消失。
这个问题在简单任务里不明显。但当你开始用 agent 处理有积累价值的工作——维护长期项目、建立个人工作流自动化、或者让 agent 理解你的代码库命名习惯——你就会发现自己在不停地重复教同一件事。
OpenClaw 爆火(346k star,GitHub 史上增速最快的项目之一)证明了市场需要什么:一个能长期陪着你的 agent。但 OpenClaw 解决的是"接入问题"——50+ 个消息平台、44000 个社区 Skills。它的 Skills 本质上是人工维护的 prompt 模板库,不会因为你用它而变得更好。
Hermes 的出发点是:Skills 应该由 agent 自己从经验中生成,并在使用中持续精炼。
这一句话的差距,决定了两个项目的天花板完全不在同一个层面。
Hermes Agent vs OpenClaw:架构哲学的根本差异
这两个项目经常被拿来比较,但大多数对比文章停留在功能表层。真正的区别是架构哲学 。
OpenClaw 是 Gateway-first :一个中心化控制器拥有 session、路由、工具执行和状态,所有东西围绕 gateway 流转。优点是接入成本低、平台覆盖广;代价是 agent 本身不积累结构化经验。
Hermes 是 Agent-loop-first :AIAgent loop 是核心同步编排引擎,gateway、cron 调度器、工具运行时、ACP 集成都围绕这个 loop 构建。整个系统的设计目标是让"执行-学习-改进"这个循环尽可能顺畅。
Hermes Agent vs OpenClaw 全面对比
阅读时间
Skills 来源 Agent 自动生成、自动精炼 社区人工维护(44000+ Skills) 架构核心 Agent loop 为中心 Gateway 控制器为中心 记忆系统 三层(工作记忆 + FTS5 跨 session + user modeling) 基础 context 持久化 GitHub Stars 26k(2026.4) 346k(2026.4) Contributors 245 1200+ 代码语言 Python TypeScript 消息平台数 14 种 50+ 种 Provider 支持 200+(含本地 Ollama) 主流 provider 部署成本 $5/月 VPS 或 Modal serverless $5/月 VPS 起 适合场景 个人深度工作流、长期积累 广泛平台接入、团队协作
底线 :OpenClaw 是"接入一切",Hermes 是"记住一切"。社区实测数据显示,Hermes 在重复性任务上速度提升约 40%,不需要任何 prompt 调整——纯粹是 Skills 积累效果。
它们不是替代关系。 社区里已经有人在并行跑两个:OpenClaw 做消息路由(WhatsApp、iMessage、IRC 等长尾平台),Hermes 跑深度任务。GitHub 上甚至有 evey-bridge-plugin 做 Claude Code + Hermes 的任务交接。
Hermes Agent 核心机制:Skills 闭环学习是怎么运作的
Skills 的生命周期 Skills 的自动生成分五步:执行 → 评估 → 提取 → 精炼 → 复用 。
任务完成后,agent 会评估这次的方法是否非平凡(non-trivial)。如果是,它会把推理过程提取成一个命名 Skill:"当上下文看起来像这样时,这个方法有效。" 下次遇到相似任务,agent 主动搜索 Skills 库并引用。Skills 随着新结果持续精炼——用得多的 Skill 会越来越准。
三层记忆架构 Hermes 的记忆系统分三层,这是它和 OpenClaw 最关键的技术差异:
工作记忆 是当前 session 的 context window,无特殊之处。
跨 session 召回 用 SQLite FTS5 全文检索 + LLM summarization。这不是向量数据库那种"语义相近"模糊匹配,而是全文精确检索,召回准确率更高。
Honcho dialectic user modeling 是被低估的第三层:agent 会主动更新对你的认知,形成跨时间的用户画像,记住你的工作习惯、偏好和技术栈。
实际效果 :社区用户配置"Hacker News 每日 AI 简报"cron 任务后,Hermes 完成任务的同时自动创建了一个 Skill。此后每次运行更快、更准,最终以语音形式推送到 Telegram。同样流程 OpenClaw 能做,但每次从零开始。
Hermes Agent 架构解剖:优点与诚实的缺陷
优点 Provider agnostic 做得彻底 :支持 Nous Portal、OpenRouter(200+ 模型)、Anthropic、OpenAI、Hugging Face、DeepSeek、本地 Ollama endpoint。切换只需 hermes model,零代码改动,零 lock-in。
六种终端 backend :local、Docker、SSH、Daytona、Singularity、Modal。Modal 和 Daytona 是 serverless 模式——agent 环境空闲时休眠,按需唤醒,一个月可能只花几块钱。
14 种 messaging 平台 :Telegram、Discord、Slack、WhatsApp、Signal、Matrix 一路到 DingTalk、Feishu、WeChat Work、Home Assistant。亚洲平台覆盖比 OpenClaw 更全面。
47 个工具、37 个 toolset ,包括 MCP 动态接入。Toolset 机制允许按场景组合工具集,不是一股脑全开。
缺陷(不能绕开) run_agent.py 9200 行 ,cli.py 8500 行 。这是非常典型的巨石文件问题。一个强调"agent 自我成长"的项目,自己的代码却是反模块化的。维护成本、阅读成本、新 contributor 上手成本都因此大幅增加——这也是 OpenClaw(TypeScript + 模块化)在 contributor 数量上碾压 Hermes 的主要原因之一。
这个技术债短期内不会优先修,选择 Hermes 必须接受。
Python 主体的另一面是优势:Atropos RL 集成——Hermes 收集的 trajectory 可以用来训练下一代 tool-calling 模型。这是 OpenClaw 没有的研究路线。
如何安装和使用 Hermes Agent
一键安装 curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
source ~/.bashrc
hermes
一行命令处理 Python、Node.js、依赖和 hermes 命令注册,支持 Linux / macOS / WSL2。Windows 原生不支持,必须上 WSL2 ,这是第一个坑。
LLM Provider 选择 向导会引导你选 LLM provider。推荐优先级:OpenRouter (覆盖最广,一个 key 到处用)> Anthropic 直接接入(Claude 系列最强)> Nous Portal(零配置,订阅制)。
常用命令速查 hermes model
hermes tools
hermes gateway
hermes doctor
hermes update
接入 Telegram(推荐首先做) 手机发消息、VPS 上跑任务、结果推送回来——这个体验彻底解锁 Hermes 的移动端使用场景。配置步骤:
hermes gateway setup
hermes gateway start
新用户第一周优先体验三个功能 Skills :先做几个相对复杂的任务(代码重构、数据整理、研究报告),观察 agent 是否自动创建 Skill。用 /skills 命令查看积累情况。前两周感受可能不强烈,第三周开始会有明显感知。
Cron 自动化 :用自然语言配置定时任务,例如"每天早上 8 点,抓取今日 Hacker News Top 10 AI 相关内容,总结后发到 Telegram"。任务跑几次后 Skills 会让它越来越快。
跨 session 搜索 :直接问 agent"上次我们讨论的 Go 项目迁移方案是什么"——FTS5 + LLM summarization,比向量数据库召回精确得多。
坑点预警 API 成本 要提前预估。社区实测(Claude Sonnet 4.5):简单 bug fix 约 $6,大型重构约 $187。Agentic 工作流天然 token 消耗高,上 frontier 模型前先用 OpenRouter 的便宜模型测流程,设好费用告警。
从 OpenClaw 迁移 有一键工具,不需要手动搬配置:
hermes claw migrate
hermes claw migrate --dry-run
可导入 SOUL.md、记忆、Skills、API key、messaging 配置等。
Hermes Agent vs Claude Code vs Codex:定位对比 这三个经常被放在一起比,但定位差距比 Hermes vs OpenClaw 更大。
Hermes Agent Claude Code Codex 定位 Personal AI Agent Coding Agent Coding Agent 持久记忆 ✅ 三层记忆 + Skills ❌ 会话结束清空 ❌ 会话结束清空 学习积累 ✅ 自动生成 Skills ❌ ❌ 最适场景 长期个人工作流 具体编码任务 批量代码生成 SWE-bench 成绩 未公开 80.8% —
实际工作流可以三者协同 :Claude Code 执行具体的编码任务(SWE-bench 80.8% 不是摆设),Hermes 维护项目上下文记忆和长期自动化,Codex 处理批量代码生成。用 Hermes 记住"我们的 Go 项目 handler 层不允许直接调用 repository",用 Claude Code 在这个约束下执行重构。
把 Hermes 当 Claude Code 替代品来用是错误的用法。
Hermes Agent 适合谁?不适合谁?
适合使用 Hermes Agent 的场景 个人开发者,把 AI agent 当长期生产力工具,愿意花初始配置时间。工作类型有重复性——同类任务反复出现,Skills 积累才有价值。自托管能力没问题,不怕管 VPS 或 Docker。对 OpenClaw 的"每次从零开始"已经感到厌倦。
不适合 Hermes Agent 的情况 团队产品集成 :架构还没到生产级别,巨石文件、文档完整度、安全审计都不够成熟。代码洁癖工程师 :run_agent.py 9200 行接受不了就别看了。想要开箱即用 :OpenClaw 或托管服务更适合。需要广泛中文消息平台 :OpenClaw 在 WeChat、QQ 方向更成熟。
成本参考 $5/月 VPS 可以跑,不需要 GPU。选 Modal serverless 的话,agent 空闲时休眠,每月计算费用接近零——只有 LLM API 调用是实际支出。
可执行建议
5 分钟快速评估法 装好之后,给 agent 一个你实际工作中会重复做的任务,比如"整理这个目录下所有 Go 文件的函数列表,生成 markdown"。跑完后用 /skills 看是否自动创建 Skill。如果没有,说明任务太简单,换一个更复杂的。看 Skill 生成、看 agent 第二次是否更快。5 分钟能告诉你核心机制是否在你的工作流上生效。
与 OpenClaw 并行部署 OpenClaw 继续跑,处理现有消息平台接入和日常 Q&A。Hermes 单独起,专门跑需要积累的深度任务——代码审查、研究报告、项目文档维护。先让 Hermes 在最有重复价值的一个场景上跑三到四周,看积累效果再决定是否扩大使用范围。
下一步行动
装好,跑 hermes setup,先接通 Telegram
第一周只用 Skills 和 cron 两个功能
三周后用 /insights 看 agent 对你的认知准不准
准了,你有了一个真正的私人技术助理;不准,说明你的工作流还不够结构化——这本身也是有价值的反馈
Hermes 现在的状态是:架构对了,工程还不够好。 但架构对了比工程好了更难。值得投入时间。
常见问题 FAQ
Hermes Agent 和 OpenClaw 哪个更好? 取决于你的需求。Hermes 适合想要 agent 持续学习和积累 Skills 的个人开发者;OpenClaw 适合需要广泛平台接入、庞大社区生态和更低上手门槛的用户。两者可以并行运行,不是非此即彼的关系。
Hermes Agent 的运行成本是多少? 框架本身开源免费。主要成本来自 LLM API 调用。社区实测:用 Claude Sonnet 4.5 做简单 bug fix 约 $6,大型重构约 $187。可以用 $5/月 VPS 自托管,或选 Modal serverless 只按使用量计费。
Hermes Agent 支持本地模型吗? 支持。通过 Custom Endpoint 配置 Ollama 或任何 OpenAI-compatible API,可以在本地跑 Qwen、DeepSeek 等开源模型。hermes model 命令一键切换,无代码改动。
如何从 OpenClaw 迁移到 Hermes Agent? 运行 hermes claw migrate,可自动导入 SOUL.md、记忆、Skills、API key、messaging 配置。支持 --dry-run 预览,不需要手动搬配置,迁移风险低。
Windows 上能用 Hermes Agent 吗? 原生 Windows 不支持。需要安装 WSL2 后在 WSL2 环境内使用,体验与 Linux/macOS 一致。
参考资料