🧠 从原理到实战
01 · Hermes Agent 是什么
理解 Hermes Agent 的定位:CLI、消息网关、记忆、技能、工具和自动化组成的自我改进型 Agent 系统。
Hermes Agent 不是一个单纯的聊天 CLI。它更像一个个人 Agent 运行时:能在终端里对话,能调用工具,能保存记忆,能安装 skills,能接入消息平台,也能把任务放到后台或定时运行。
最小心智模型可以拆成六层:
- 对话入口:CLI、TUI、Telegram、Discord、Slack、Email、Web。
- 模型层:provider、model、context size、fallback。
- 工具层:terminal、file、web、browser、vision、MCP、delegation。
- 记忆层:
MEMORY.md、USER.md、session search、外部 memory provider。 - 能力层:skills、slash commands、toolsets、agent-managed skills。
- 治理层:allowlist、terminal backend、approval、logs、config。
它和普通 Coding Agent 的差异
Claude Code 和 Codex 更强调“在项目里完成 coding task”。Hermes Agent 的关注面更宽:它可以是 coding assistant,也可以是常驻消息 bot、自动化任务执行器、skill runtime、长期记忆代理和工具网关。
所以使用 Hermes 时,重点不是问“它能不能帮我写代码”,而是问:
- 它是否需要跨会话记住我和环境。
- 它是否需要接消息平台,变成常驻助手。
- 它是否需要定时跑任务。
- 它是否需要把成功流程沉淀成 skill。
- 它是否需要在 Docker、SSH 或云沙箱中执行命令。
如果答案都是“否”,你可能只需要普通 CLI agent。如果答案有多个“是”,Hermes 的组合能力才开始体现价值。
自我改进在哪里
Hermes 的“自我改进”不是神秘概念,落在几个具体机制上:
- 通过 memory 保存长期偏好和环境事实。
- 通过 session search 召回过去会话。
- 通过 skills 把成功流程沉淀成可复用能力包。
- 通过 gateway 让 agent 跨平台持续服务。
- 通过 cron 和 background session 执行周期任务。
- 通过 toolset 和 terminal backend 控制它能做什么、在哪里做。
这些机制叠起来,Hermes 才不只是“每次都从零开始聊天”。
使用边界
Hermes 的能力面越大,治理越重要。尤其是 gateway、terminal、cron、MCP 和消息平台组合起来以后,它可能成为一个有真实权限的常驻系统。
不要一开始就打开所有能力。正确顺序是:
- 先跑本机普通对话,确认 provider 和 model 稳定。
- 再打开 session 恢复,让它能延续工作。
- 然后配置工具和终端后端,明确命令在哪里执行。
- 接着引入 memory 和 skills,把偏好和流程沉淀下来。
- 最后再接消息网关、cron、background session 和 delegation。
每上一层,都要重新检查权限、日志和失败模式。