Hermes Agent 為什麼必須 7×24 常駐?三層記憶架構與 Mac Mini M4 資源消耗實測

三層記憶拆解 · 重啟≠丟記憶 · 樹莓派/VPS/M4 矩陣 · 24 個月租購 · 六步 Runbook

Hermes Agent 三層記憶架構與 Mac Mini M4 7×24 常駐

Hermes Agent 的「變聰明」不靠玄學,靠三層記憶在磁碟上複利:USER.md1,375 字元刻畫你是誰、MEMORY.md 單條上限約 2,200 字元沉澱流程、SQLite FTS5 做全文檢索;任務完成且累計 5+ 次工具呼叫後才觸發 Skill 寫入。本文從架構出發解釋為何必須 7×24 常駐,用樹莓派 / VPS / Mac Mini M4 資源矩陣對照實測占用,給出 24 個月 TCO六步 Runbook——重啟不會清空已落盤記憶,但 Gateway 休眠會讓通道與 Skill 打磨鏈斷裂。

01

三層記憶架構:USER.md、MEMORY.md 與 SQLite FTS5 如何協同

很多人把 Nous Research Hermes Agent 當成「帶工具的聊天殼」,但官方與社群拆解的持久層遠比工作階段視窗深。第一層是當前工作階段短期上下文——工具鏈狀態、本輪推理軌跡,程序在記憶體裡,重啟即斷。第二層是Skill Documents:任務結束後自動產生的 markdown 流程卡,經去重與注入掃描後寫入資料目錄;社群口徑單條約 2,200 字元,適合 checklist 而非長篇散文。第三層是持久使用者模型:以 USER.md(約 1,375 字元預算)記錄偏好、口吻與長期目標,跨週緩慢加深。

檢索側,Hermes 用 SQLite FTS5 對 Skill 與記憶條目建全文索引——Agent 下發指令時先查本機索引再注入上下文,這比每次把整庫塞進 prompt 省 token,也解釋為何磁碟 IO 與索引完整性和算力同樣重要。Skill 生成有硬門檻:一次複雜任務需累計 至少 5 次工具呼叫才會觸發提煉——這意味著「隨便聊兩句」不會污染 Skill 庫,但也意味著你要給 Agent 足夠長的工具鏈 runway,宿主不能在中途被合蓋掛起。

記憶元件典型體量 / 機制重啟後是否保留對 7×24 的含義
短期上下文當前工作階段與工具狀態否,需重連Gateway 程序必須在線;IM 回呼逾時 = 任務鏈斷裂
USER.md約 1,375 字元使用者畫像是,落盤換機需遷移資料目錄;頻繁休眠拖慢畫像迭代
MEMORY.md / Skill單條約 2,200 字元上限是,落盤FTS5 索引隨寫入增長;備份策略不可省
SQLite FTS5本機全文檢索索引是,資料庫檔案磁碟抖動或 VPS IO 限流會拖檢索延遲

因此「重啟 ≠ 丟記憶」只對已落盤的層成立;通道側體驗、cron 定時任務與正在進行的 5+ 工具鏈仍會中斷。若你關心 30 天主觀體驗與踩坑敘事,可對照前一篇30 天 Hermes 親歷;本文專注架構與資源帳。

  1. 01

    誤以為重啟清空一切:Skill 與 USER.md 在資料目錄;丟的是工作階段節奏,不是全部資產——但若從不備份,換宿主仍可能「像失憶」。

  2. 02

    忽視 5+ 工具呼叫門檻:短對話不產生 Skill;長任務跑到一半宿主休眠,提煉環永遠完不成。

  3. 03

    把 FTS5 當黑盒:索引損壞或磁碟滿會導致「明明寫過卻檢索不到」;需監控資料目錄體積與 SQLite 健康。

  4. 04

    USER.md 超限不修剪:1,375 字元預算有限;長期不整理會讓畫像稀釋,Agent 抓錯偏好權重。

  5. 05

    通道與 Gateway 分離部署:閘道停而模型在雲端仍跑,IM 側照樣斷;7×24 要的是整條鏈路在線。

02

為什麼 Hermes Agent 必須 7×24 常駐?Gateway、通道與 Skill 複利

Hermes 的設計假設是Always-on Agent:Telegram / Discord / Slack 等 20+ 通道透過 Gateway 收 webhook,cron 按 schedule 喚醒子任務,Honcho 一類機制在背景緩慢更新使用者模型。任一環節離線,表現不是「稍慢」,而是回呼失敗、佇列堆積、Skill 寫入延遲——主觀上像「每週換助理」,儘管磁碟裡 Skill 檔案仍在增多。

7×24 不是為了炫維運,而是匹配三層記憶的時間維度:短期層要毫秒級回應;Skill 層要長任務跑完 5+ 工具呼叫;使用者模型層要跨週累積。筆電合蓋、家用 NAS 間歇離線、VPS 被鄰居 IO 拖死——都會讓不同層「各斷一截」,最終複利曲線變平。專用宿主的價值是把程序存活、網路穩定、磁碟可預測變成 SLA,而不是賭使用者記得給機器續電。

記憶在磁碟上複利,但聰明的感覺來自 Gateway 從不缺席——這是 7×24 與「偶爾開機跑一下」的本質差別。

常駐節點最低驗收標準

  • 程序:Gateway + 執行後端 30 天無人工重啟(系統更新除外,需變更窗口)。
  • 通道:任選 IM 下發任務,24h 內無逾時;cron 任務準時觸發。
  • 資料:資料目錄可寫、FTS5 可檢索;每週備份可恢復 USER.md 與 Skill。
  • 資源:記憶體峰值留 ≥ 20% 餘量,避免 OOM 殺 Gateway 程序。
03

樹莓派、VPS、Mac Mini M4:Hermes 資源消耗實測矩陣

同一套 curl -fsSL https://get.hermes-agent.org | bash,換宿主後差異在記憶體頻寬、磁碟 IO、macOS 原生路徑。下表為同一工作負載(Gateway + Telegram + 本機 Ollama Hermes-3 8B 間歇推理)下的定性實測區間,便於評審會拍板;精確數字隨模型量化與通道數變化。

宿主方案閒置 RAM峰值 RAMCPU / 功耗Hermes 適配度
樹莓派 5 · 8GB≈ 1.5GB 系統餘量Gateway 單獨 ≈ 4GB;本機 8B 模型不可行ARM 低功耗;SD 卡 IO 瓶頸僅適合純 API 閘道;Skill 複利弱
Linux VPS 4C8G≈ 5GB 可用API 模式 ≈ 6GB;Docker 後端 +2GB共享 vCPU 抖動;磁碟 IOPS 限遠端 SSH 可用;非 macOS,部分 Skill 彆扭
Mac Mini M4 16GB≈ 9GB 可用本機 8B + 通道 ≈ 14–15GB觸頂閒置 ≈ 12W;推理 burst 25–35WmacOS 原生;單通道 + 本機模型極限
Mac Mini M4 32GB≈ 22GB 可用8B + 雙通道 + cron ≈ 18–20GB同上,記憶體壓力小生產推薦:Skill + FTS5 增長有餘量

統一記憶體(UMA)讓 M4 在本機推理時少一層 CPU↔GPU 拷貝;macOS 則讓官方安裝腳本與 Ollama 路徑最少折騰。樹莓派省電費但頂不住 8B 模型;VPS 月租低卻常在跨區 RTT 與 IO 限流上虧時間——當 Skill 庫與 FTS5 索引上到 GB 級,你會更在意磁碟延遲是否穩定而非首月租金差幾十元。

04

24 個月 TCO:自購 Mac Mini M4 vs 月租算力服務

Agent 玩家的決策對象不是「買不買蘋果」,而是24 個月內把記憶複利跑滿的總成本——含硬體、電費、維運工時、換代焦慮與資料遷移。月租把 CapEx 轉成 OpEx,對 Skill 與通道已是生產負載的團隊,常比自購更省決策成本

TCO 維度(24 個月)自購 M4 16GB月租 M4 32GB
硬體現金流 upfront ≈ 設備價 + 稅;折舊自行估算固定月費 × 24;可升配不整機換
電費(7×24)≈ 12–35W × 24h × 730 天(自付)含在服務費;機房 PUE 由服務商承擔
維運工時保固、系統升級、風扇與斷網自擔硬體故障換機;遠端 KVM 現成
Hermes 資料資產USER.md / Skill / FTS5 綁單機;換機遷移備份 → 新租約恢復;退租可擦除
換代風險M 系迭代誘惑二次投入合約期滿換規格,無殘值糾結
機會成本研究硬體分散 Skill 打磨時間專注 Agent 工作流與通道擴展

六步 Runbook:租機到 FTS5 索引驗收

  1. 01

    選配記憶體:純 API + 單通道可 16GB;本機 Hermes-3 + 多通道 + cron 建議 32GB,避免 FTS5 重建時 OOM。

  2. 02

    簽約收貨:記錄租約 ID、遠端接入方式;企業場景提前確認 MDM 與團隊 Profile 分發。

  3. 03

    系統驗收:Apple Silicon、磁碟 ≥ 256GB、macOS 版本滿足官方 Hermes 路徑;關閉自動休眠。

  4. 04

    安裝 Hermes:執行官方一鍵腳本並 hermes init;確認資料目錄路徑與備份策略。

  5. 05

    7×24 冒煙:綁 IM 通道,下發含 5+ 工具呼叫的長任務;24h 後檢查 Skill 是否寫入、FTS5 可檢索。

  6. 06

    備份與退租預案:定期匯出資料目錄;退租前遷移 USER.md / Skill 並按流程擦除磁碟。

bash · macOS
curl -fsSL https://get.hermes-agent.org | bash
hermes init
hermes model

提示:生產節點請固定 Hermes 版本並寫入變更單;hermes model 切換後端後觀察 24h 記憶體曲線,再開第二個 IM 通道。

05

可引用參數與收束

  • USER.md 預算:1,375 字元,用於跨工作階段使用者畫像;超限需人工或 Agent 修剪,否則偏好權重稀釋。
  • MEMORY.md / Skill 上限:單條約 2,200 字元,带去重與注入掃描;適合流程 checklist。
  • Skill 觸發門檻:單次任務累計 ≥ 5 次工具呼叫後自動提煉;短對話不寫入 Skill 庫。
  • 檢索引擎:本機 SQLite FTS5 全文索引;資料目錄增長需納入磁碟與備份規劃。
  • 記憶體實測:Gateway 閒置約 200–400MB;Ollama Hermes-3 8B 峰值常 8–12GB;生產建議 32GB UMA
  • 功耗量級:Mac Mini M4 7×24 閒置約 12W 級,推理 burst 25–35W,適合弱電櫃常駐。

Hermes Agent 的護城河是三層記憶在磁碟上複利,但兌現複利需要 Gateway 7×24、FTS5 索引健康、足夠統一記憶體跑完 5+ 工具鏈。樹莓派與 VPS 能完成安裝,卻在本機推理或 IO 穩定性上削薄 Skill 曲線;Mac Mini M4 月租把硬體變成可預測服務,讓你把精力放在 USER.md 打磨與通道擴展,而非風扇與換代。

若你已決定用專用 Apple Silicon 節點跑 Hermes,下一步是算清套餐與交付節奏:VpsMesh Mac Mini M4 月租提供 16/32GB 統一記憶體、遠端接入與退租資料清除流程。價格見 Mac Mini M4 租用價格,部署與 FAQ 見 雲端說明中心,線上選配見 訂購頁

注意:勿在同一週末同時遷移宿主、重建 FTS5 索引、清空 Skill 目錄——三角變更無法二分定位。先遷機並驗證 24h Gateway 穩定,再動模型路由或批量匯入記憶。

常見問題

讀者最常問的三個問題

不會。已寫入磁碟的 Skill DocumentsUSER.mdMEMORY.mdSQLite FTS5 索引檔案會保留;僅當前工作階段短期上下文中斷。關鍵是 Gateway 與資料目錄在7×24 穩定節點上,並做好定期備份——頻繁休眠的筆電仍會讓通道與長任務鏈斷檔。

Gateway 閒置約 200–400MB;本機 Ollama 跑 Hermes-3 8B 時峰值常達 8–12GB。通道 + cron + 本機推理並行時,16GB 易觸頂,32GB 統一記憶體更穩妥。套餐對照見 價格頁

若目標是 Skill 複利與通道穩定而非硬體資產,24 個月月租把折舊與換代風險轉為固定 OpEx,總擁有成本常低於自購加維運工時。適合個人與小團隊專注 Agent 工作流。下單與交付見 訂購頁,部署問題見 雲端說明中心