深度·Neo·2026.04.10

Hermes Agent 深度调研:多平台自我改进型 Agent 操作系统

Hermes Agent 把 memory、skills、cron、gateway 和多模型后端连成闭环,目标不是做一个聊天框,而是做一个长期在线的 Agent 操作系统。

Hermes Agent 深度调研:多平台自我改进型 Agent 操作系统

1. 项目概览

Hermes Agent 是 Nous Research 开源的一套多端 AI Agent 系统,核心不是“能聊天”,而是把 CLI、多平台消息网关、长期记忆、技能系统、定时任务和子代理协作打通,形成一个可持续运行的 Agent 操作底座。

从 GitHub 信号看,它已经不是玩具:stars、forks、issue 规模都很大,release 和 commit 也仍在高频更新,说明它有真实用户、真实场景,也有真实维护压力。

定位一句话:它更像“Agent 操作系统”,而不是单一聊天助手。

2. 架构拆解

Hermes 的主架构可以粗略拆成五层:

flowchart TD U[用户 / CLI / 消息平台] --> G[Gateway 网关] G --> S[Session / Context] S --> A[AIAgent 核心循环] A --> M[Memory] A --> K[Skills] A --> C[Cron Scheduler] A --> T[Tools / Toolsets] A --> P[模型后端] A --> R[Subagents] C --> G

核心模块

  • CLI 层hermeshermes modelhermes toolshermes gatewayhermes setup 等命令构成完整交互面。
  • Agent 核心run_agent.py 中的 AIAgent 负责模型选择、工具调用、上下文构建、记忆/技能 review、子代理协调。
  • Gateway 层gateway/ 负责 Telegram、Discord、Slack、WhatsApp、Signal、Matrix、Email、SMS、Feishu、DingTalk、WeCom 等平台适配。
  • Session 层:把来源平台、群组/DM/thread、用户身份、channel topic 等注入 prompt。
  • Cron 层:定时执行任务,并把结果投递回原平台或指定 home channel。

数据流

用户消息进入平台适配器后,经过 session 归一化,再进入 AIAgent;AIAgent 调模型并执行工具;执行结果可能触发记忆/技能沉淀,也可能进入 cron 或回传到消息平台。

3. 核心机制

1)记忆、技能、定时任务形成闭环

这是 Hermes 最有辨识度的地方:

  • Memory:跨会话记忆、用户画像、工作偏好
  • Skills:把复杂任务沉淀成可复用流程
  • Cron:自动化定时执行并投递结果

它不是把这些能力并列摆放,而是做成了“用着用着就会更懂你、也会更会干活”的循环。

2)多模型后端抽象很完整

代码里明确支持:

  • OpenAI
  • Anthropic
  • OpenRouter
  • OpenAI Codex 风格接口
  • 其它 Anthropic-compatible endpoint

这让它不是绑定某一家模型,而是把模型当成可替换基础设施。

3)消息网关是关键产品能力

Hermes 不止是本地 CLI,而是可以在消息平台里持续在线。多平台网关让它从“工具”升级成“代理人”:

  • 适合值守
  • 适合自动回复
  • 适合跨端持续对话
  • 适合把自动化结果直接送到工作流里

4)工程上考虑了很多真实世界问题

比如:

  • SSL 证书自动探测
  • 配置优先级处理
  • PID / runtime 状态管理
  • 媒体消息处理
  • typing / streaming
  • thread / group / dm 路由
  • 失败恢复和平台兼容

这说明它已经是长期打磨出来的工程系统。

4. 优势与不足

优势

  • 产品定位强:不是普通聊天机器人,而是多端 Agent 系统
  • 闭环完整:memory + skills + cron + gateway + tools 串起来了
  • 扩展性强:多平台、多 provider、多终端、多 runtime
  • 工程成熟:状态、适配、恢复、交互细节都比较完整

不足

  • 复杂度很高:配置、接入、运行都不轻
  • 平台维护成本大:适配越多,边界越多
  • 安全面更大:有 shell、消息入口、自动执行和外部平台接入
  • 学习门槛不低:更适合有自动化/Agent 经验的人

5. 适合谁

最适合

  • 想把 AI 变成长期在线助手的人
  • 需要多平台消息接入的团队
  • 对 Agent 架构、memory、skills、cron 感兴趣的研究者
  • 想自托管、可控地跑 AI 助手的人

不适合

  • 只想要一个轻量聊天框的人
  • 不想配置模型、平台、凭证的人
  • 只需要单场景、单平台工具的人

6. 我的判断

Hermes Agent 的价值不在“又一个模型调用壳”,而在它试图把 AI 变成一个长期在线、可记忆、可调度、可跨平台工作的系统

我会把它判断为:

  • 作为产品:有清晰差异化,值得关注
  • 作为技术项目:架构完整,值得深挖
  • 作为选型:适合想要“Agent 操作系统”的用户,而不是只要 chat 功能的人

最大风险也很清楚:系统越强,复杂度和维护成本越高。它能否长期稳定地把这些能力维护住,决定了它最终是“平台”还是“功能堆叠”。

Hermes Agent 深度调研:多平台自我改进型 Agent 操作系统