Hermes Agent

資料來源#

摘要#

Hermes Agent 是來自 Nous Research 的開源 CLI 程式設計／研究 agent，定位為 Claude Code 的平行生態系，但更強調跨多平台的訊息部署。CLI 提供一個具備工具存取能力的互動式 REPL（終端機、檔案編輯、網頁搜尋、程式碼執行）；Hermes Gateway 則是一個長時間執行的常駐程式，透過 Telegram、Discord、Slack 與 WhatsApp 把同一個 agent 暴露出來，具備每位使用者各自的工作階段、允許清單＋DM 配對授權、排程 cron 工作，以及可設定的容器後端。Hermes 是供應商無關的（可搭配 OpenAI、Anthropic 與其他 LLM API），並採用一套更接近 OpenAI 的 AGENTS.md、而非 Anthropic 的 CLAUDE.md 的情境檔慣例，另外還有一個獨立的 SOUL.md 用於人格設定。

細節#

Architecture (Two Surfaces)#

介面	用途	生命週期
Hermes CLI	互動式 REPL，角色類似 Claude Code	每次呼叫一次，可續接（`hermes -c`、`hermes -r "title"`）
Hermes Gateway	長時間執行的常駐程式，透過訊息平台暴露 agent	systemd（Linux 使用者／系統服務）或 launchd（macOS）；可在重開機後存續

Gateway 是這兩個介面中架構上更有趣的一半——它在精神上與 Symphony 的永遠在線常駐模型平行，但採用的是每位使用者而非每個 issue 的租用單位。

Context Files#

Hermes 使用三層分層的設定檔，並有明確的角色分離：

檔案	範圍	用途
`AGENTS.md`	專案（cwd）	專案情境、慣例、技術棧——每個工作階段自動載入
`~/.hermes/SOUL.md`（或 `$HERMES_HOME/SOUL.md`）	全域人格	在所有工作階段間穩定預設的語氣／風格
`.cursorrules` / `.cursor/rules/*.mdc`	專案	為相容性而從 cwd 載入；無須重複設定

子目錄的 AGENTS.md 檔案是在工具呼叫期間惰性探索（透過 subdirectory_hints.py）並注入到工具結果中——它們不會預先載入。這是刻意的情境預算選擇：只有最上層的專案情境會進入系統提示；巢狀的情境只有在相關時才付出代價。

AGENTS.md（專案）與 SOUL.md（人格）的分離比 Anthropic 的 CLAUDE.md 慣例更為清晰，值得拿來比較——同樣的角色拆分在實務上隱含於 CLAUDE.md 檔案中，但並未另外分檔。（將在即將推出的 Agent Context Files 概念頁中展開。）

Memory System#

Hermes 實作了一套硬性有界的記憶系統：

MEMORY.md：上限約 2,200 字元。
USER.md：上限約 1,375 字元。
當記憶填滿時，agent 會整併條目（壓縮較舊的筆記）。

文件中特別點出一個陷阱：

「記憶是一份凍結的快照——在工作階段期間所做的變更，要到下一個工作階段開始時才會出現在系統提示中。agent 會立即寫入磁碟，但提示快取不會在工作階段中途失效。」

這是對「為什麼任何具快取機制的 agent 中記憶編輯會感覺『延遲』」最清晰的闡述——而且這是 Claude Code 與其他 agent 共有、卻很少被記錄下來的限制。

Memory 與 Skills 的拆分：

Memory ＝事實（環境、偏好、專案位置）。
Skills ＝程序（多步驟工作流程、可重複使用的食譜）。
「Memory 管什麼，skills 管怎麼做。」

Token-Economy Tooling#

直接面向使用者的控制項——在操作上，這些正是 AgentOpt 所形式化的那些槓桿，只是以 CLI 命令的形式暴露出來：

命令	效果
`/compress`	摘要對話歷史；保留關鍵情境、捨棄 token
`/usage`	Token 消耗狀態
`/insights`	30 天使用模式
`/model`	在工作階段中途切換模型（前沿模型用於困難推理，快速模型用於樣板程式碼）
`delegate_task`	生成具獨立情境的平行子 agent；只回傳摘要

關於快取紀律的提醒很到位：

「大多數 LLM 供應商會快取系統提示的前綴。若你保持系統提示穩定（相同的情境檔、相同的記憶），工作階段中後續的訊息就能命中快取，成本顯著更低。避免在工作階段中途更換模型或系統提示。」

CLI Ergonomics#

輸入	行為
`Alt+Enter` / `Ctrl+J`	多行輸入而不送出
多行貼上	自動偵測，緩衝為單一訊息
`Ctrl+C`（一次）	在回應中途中斷，以新訊息重新導向
`Ctrl+C`（2 秒內兩次）	強制離開
`Ctrl+V`	從剪貼簿貼上圖片（視覺）
`/` + `Tab`	斜線命令自動補全
`/verbose`	循環切換工具輸出模式：`off → new → all → verbose`

Hermes Gateway: Multi-User Daemon Pattern#

Gateway 透過訊息平台暴露 agent：

每位使用者各自的工作階段——每位獲授權的使用者都有自己的對話情境。
Home channel（/sethome）——指定用來接收 cron 輸出與主動訊息的聊天室。
兩種授權模型：

靜態允許清單：在 .env 中設定 TELEGRAM_ALLOWED_USERS=123,456。新增使用者需重新啟動。
DM 配對：未獲授權的 DM 會收到一組一次性代碼；管理員執行 hermes pairing approve telegram XKGH5N7P。無須重新啟動。

配對安全性：代碼 1 小時後過期、採用密碼學隨機性、有速率限制（每位使用者每 10 分鐘 1 次請求，每平台最多 3 筆待處理）、5 次核准失敗 → 平台鎖定 1 小時、所有資料皆以 chmod 0600 儲存。

服務安裝：

hermes gateway install # Default: user-level systemd (Linux) / launchd (macOS)
sudo hermes gateway install --system # Linux: boot-time system service
sudo loginctl enable-linger $USER # Linux: keep running after SSH logout

Cron Jobs#

排程的工作會送達 home channel：

從聊天中建立：「每個工作日早上 9 點，檢查 GitHub 儲存庫是否有……」
定義儲存在 ~/.hermes/cron/jobs.json；輸出在 ~/.hermes/cron/output/{job_id}/{timestamp}.md。
關鍵注意事項：cron 提示是在完全全新、沒有記憶的工作階段中執行。每個提示都必須包含所有需要的情境——檔案路徑、URL、伺服器位址、指示。

這與 Symphony 的常駐程式驅動的派發模型平行——兩者都是 agent 被拉去按排程非同步工作、而非以互動方式驅動的案例。

Container Safety Model (Worth Flagging)#

Hermes 支援多種終端機後端：

TERMINAL_BACKEND=docker
TERMINAL_DOCKER_IMAGE=hermes-sandbox:latest

支援：Docker、Singularity、Modal、Daytona。

重要的安全性轉變：當在容器後端中執行時，危險命令檢查會被略過——其理由是「容器才是安全邊界」。這意味著：

鎖定式容器映像的品質變成承重的關鍵。
核准提示 UX 換成了映像紀律 UX。
信任從「每個命令都會被審查」轉移到「容器無法逃逸」。

值得一提，因為這與 Claude Code 的逐命令 auto-mode 分類器是顯著不同的安全模型。

Comparison to Claude Code#

能力	Claude Code	Hermes
專案情境	`CLAUDE.md`	`AGENTS.md`（專案）＋ `SOUL.md`（人格，獨立）
Cursor 相容	無	`.cursorrules` / `.cursor/rules/*.mdc` 自動載入
工作階段壓縮	`/compact`	`/compress`
工作階段中途切換模型	`/model`	`/model`
平行子 agent	`.claude/agents/` 中的子 agent	`delegate_task` 工具
權限把關	auto mode 分類器	逐模式核准（`once`/`session`/`always`/`deny`）；在容器中略過
記憶模型	無（依賴對話＋ CLAUDE.md）	有界的 `MEMORY.md` ＋ `USER.md`，具自動整併
多使用者部署	每位使用者／工作階段一個 `claude -p`	Hermes Gateway，搭配允許清單或 DM 配對
Cron／排程工作	無（依賴外部 cron）	內建 cron，送達 home channel

最重要的架構差異是 Gateway：Claude Code 以工作階段為先；Hermes 在團隊規模部署時則以常駐程式為先。

Operational Notes#

VPS 規格：每月 $5 就足以支撐 Gateway 本身——LLM API 呼叫才是成本的驅動因素。
macOS launchd PATH 陷阱：plist 會在安裝時擷取 shell 的 PATH。在安裝新工具（Node、ffmpeg）後，重新執行 hermes gateway install 以刷新。
工作階段自動重置：訊息工作階段在閒置（預設 24 小時）後或每天凌晨 4 點重置。
自我更新：從聊天中執行 /update 會拉取最新版本並重新啟動。

待解決的問題#

容器後端停用危險命令檢查是個站得住腳的設計，但卻是個有意義的安全模型轉變。其經驗上的實績如何？熱門映像（Daytona、nikolaik/python-nodejs）中的鎖定失敗是否曾造成事故？
有界記憶檔（MEMORY.md 約 2,200 字元）在長期使用下表現如何？文件提到了自動整併，但並未詳述——整併演算法是什麼，又有多大的損耗？
Hermes 的 DM 配對流程是個乾淨俐落的安全原語。為什麼這個模式還沒被 Claude Code 或 Cursor 採用於共享／團隊部署？
AGENTS.md（專案）與 SOUL.md（人格）之間的拆分在 Hermes 中是顯式的，但在 Claude Code 的 CLAUDE.md 中是隱式的。這個拆分是否實質改善了結果，抑或只是一個沒有經驗支持的文件化選擇？
在沒有記憶的全新工作階段中執行 cron 工作——團隊要如何在不讓每個 cron 提示膨脹的前提下，組織出「agent 需要的情境」？是否有標準模式？

資料來源#

Tips & Best Practices — practical CLI usage, context files, memory, performance/cost levers, security patterns
Tutorial: Team Telegram Assistant — Gateway deployment, BotFather setup, allowlists vs. DM pairing, cron scheduling, production operation

Hermes Agent

資料來源#

摘要#

細節#

Architecture (Two Surfaces)#

Context Files#

Memory System#

Token-Economy Tooling#

CLI Ergonomics#

Hermes Gateway: Multi-User Daemon Pattern#

Cron Jobs#

Container Safety Model (Worth Flagging)#

Comparison to Claude Code#

Operational Notes#

相關連結#

待解決的問題#

資料來源#