三層記憶拆解 · 重啟≠丟記憶 · 樹莓派/VPS/M4 矩陣 · 24 個月租購 · 六步 Runbook
Hermes Agent 的「變聰明」不靠玄學,靠三層記憶在磁碟上複利:USER.md 約 1,375 字元刻畫你是誰、MEMORY.md 單條上限約 2,200 字元沉澱流程、SQLite FTS5 做全文檢索;任務完成且累計 5+ 次工具呼叫後才觸發 Skill 寫入。本文從架構出發解釋為何必須 7×24 常駐,用樹莓派 / VPS / Mac Mini M4 資源矩陣對照實測占用,給出 24 個月 TCO 與六步 Runbook——重啟不會清空已落盤記憶,但 Gateway 休眠會讓通道與 Skill 打磨鏈斷裂。
很多人把 Nous Research Hermes Agent 當成「帶工具的聊天殼」,但官方與社群拆解的持久層遠比工作階段視窗深。第一層是當前工作階段短期上下文——工具鏈狀態、本輪推理軌跡,程序在記憶體裡,重啟即斷。第二層是Skill Documents:任務結束後自動產生的 markdown 流程卡,經去重與注入掃描後寫入資料目錄;社群口徑單條約 2,200 字元,適合 checklist 而非長篇散文。第三層是持久使用者模型:以 USER.md(約 1,375 字元預算)記錄偏好、口吻與長期目標,跨週緩慢加深。
檢索側,Hermes 用 SQLite FTS5 對 Skill 與記憶條目建全文索引——Agent 下發指令時先查本機索引再注入上下文,這比每次把整庫塞進 prompt 省 token,也解釋為何磁碟 IO 與索引完整性和算力同樣重要。Skill 生成有硬門檻:一次複雜任務需累計 至少 5 次工具呼叫才會觸發提煉——這意味著「隨便聊兩句」不會污染 Skill 庫,但也意味著你要給 Agent 足夠長的工具鏈 runway,宿主不能在中途被合蓋掛起。
| 記憶元件 | 典型體量 / 機制 | 重啟後是否保留 | 對 7×24 的含義 |
|---|---|---|---|
| 短期上下文 | 當前工作階段與工具狀態 | 否,需重連 | Gateway 程序必須在線;IM 回呼逾時 = 任務鏈斷裂 |
| USER.md | 約 1,375 字元使用者畫像 | 是,落盤 | 換機需遷移資料目錄;頻繁休眠拖慢畫像迭代 |
| MEMORY.md / Skill | 單條約 2,200 字元上限 | 是,落盤 | FTS5 索引隨寫入增長;備份策略不可省 |
| SQLite FTS5 | 本機全文檢索索引 | 是,資料庫檔案 | 磁碟抖動或 VPS IO 限流會拖檢索延遲 |
因此「重啟 ≠ 丟記憶」只對已落盤的層成立;通道側體驗、cron 定時任務與正在進行的 5+ 工具鏈仍會中斷。若你關心 30 天主觀體驗與踩坑敘事,可對照前一篇30 天 Hermes 親歷;本文專注架構與資源帳。
誤以為重啟清空一切:Skill 與 USER.md 在資料目錄;丟的是工作階段節奏,不是全部資產——但若從不備份,換宿主仍可能「像失憶」。
忽視 5+ 工具呼叫門檻:短對話不產生 Skill;長任務跑到一半宿主休眠,提煉環永遠完不成。
把 FTS5 當黑盒:索引損壞或磁碟滿會導致「明明寫過卻檢索不到」;需監控資料目錄體積與 SQLite 健康。
USER.md 超限不修剪:1,375 字元預算有限;長期不整理會讓畫像稀釋,Agent 抓錯偏好權重。
通道與 Gateway 分離部署:閘道停而模型在雲端仍跑,IM 側照樣斷;7×24 要的是整條鏈路在線。
Hermes 的設計假設是Always-on Agent:Telegram / Discord / Slack 等 20+ 通道透過 Gateway 收 webhook,cron 按 schedule 喚醒子任務,Honcho 一類機制在背景緩慢更新使用者模型。任一環節離線,表現不是「稍慢」,而是回呼失敗、佇列堆積、Skill 寫入延遲——主觀上像「每週換助理」,儘管磁碟裡 Skill 檔案仍在增多。
7×24 不是為了炫維運,而是匹配三層記憶的時間維度:短期層要毫秒級回應;Skill 層要長任務跑完 5+ 工具呼叫;使用者模型層要跨週累積。筆電合蓋、家用 NAS 間歇離線、VPS 被鄰居 IO 拖死——都會讓不同層「各斷一截」,最終複利曲線變平。專用宿主的價值是把程序存活、網路穩定、磁碟可預測變成 SLA,而不是賭使用者記得給機器續電。
記憶在磁碟上複利,但聰明的感覺來自 Gateway 從不缺席——這是 7×24 與「偶爾開機跑一下」的本質差別。
同一套 curl -fsSL https://get.hermes-agent.org | bash,換宿主後差異在記憶體頻寬、磁碟 IO、macOS 原生路徑。下表為同一工作負載(Gateway + Telegram + 本機 Ollama Hermes-3 8B 間歇推理)下的定性實測區間,便於評審會拍板;精確數字隨模型量化與通道數變化。
| 宿主方案 | 閒置 RAM | 峰值 RAM | CPU / 功耗 | Hermes 適配度 |
|---|---|---|---|---|
| 樹莓派 5 · 8GB | ≈ 1.5GB 系統餘量 | Gateway 單獨 ≈ 4GB;本機 8B 模型不可行 | ARM 低功耗;SD 卡 IO 瓶頸 | 僅適合純 API 閘道;Skill 複利弱 |
| Linux VPS 4C8G | ≈ 5GB 可用 | API 模式 ≈ 6GB;Docker 後端 +2GB | 共享 vCPU 抖動;磁碟 IOPS 限 | 遠端 SSH 可用;非 macOS,部分 Skill 彆扭 |
| Mac Mini M4 16GB | ≈ 9GB 可用 | 本機 8B + 通道 ≈ 14–15GB觸頂 | 閒置 ≈ 12W;推理 burst 25–35W | macOS 原生;單通道 + 本機模型極限 |
| Mac Mini M4 32GB | ≈ 22GB 可用 | 8B + 雙通道 + cron ≈ 18–20GB | 同上,記憶體壓力小 | 生產推薦:Skill + FTS5 增長有餘量 |
統一記憶體(UMA)讓 M4 在本機推理時少一層 CPU↔GPU 拷貝;macOS 則讓官方安裝腳本與 Ollama 路徑最少折騰。樹莓派省電費但頂不住 8B 模型;VPS 月租低卻常在跨區 RTT 與 IO 限流上虧時間——當 Skill 庫與 FTS5 索引上到 GB 級,你會更在意磁碟延遲是否穩定而非首月租金差幾十元。
Agent 玩家的決策對象不是「買不買蘋果」,而是24 個月內把記憶複利跑滿的總成本——含硬體、電費、維運工時、換代焦慮與資料遷移。月租把 CapEx 轉成 OpEx,對 Skill 與通道已是生產負載的團隊,常比自購更省決策成本。
| TCO 維度(24 個月) | 自購 M4 16GB | 月租 M4 32GB |
|---|---|---|
| 硬體現金流 | upfront ≈ 設備價 + 稅;折舊自行估算 | 固定月費 × 24;可升配不整機換 |
| 電費(7×24) | ≈ 12–35W × 24h × 730 天(自付) | 含在服務費;機房 PUE 由服務商承擔 |
| 維運工時 | 保固、系統升級、風扇與斷網自擔 | 硬體故障換機;遠端 KVM 現成 |
| Hermes 資料資產 | USER.md / Skill / FTS5 綁單機;換機遷移 | 備份 → 新租約恢復;退租可擦除 |
| 換代風險 | M 系迭代誘惑二次投入 | 合約期滿換規格,無殘值糾結 |
| 機會成本 | 研究硬體分散 Skill 打磨時間 | 專注 Agent 工作流與通道擴展 |
選配記憶體:純 API + 單通道可 16GB;本機 Hermes-3 + 多通道 + cron 建議 32GB,避免 FTS5 重建時 OOM。
簽約收貨:記錄租約 ID、遠端接入方式;企業場景提前確認 MDM 與團隊 Profile 分發。
系統驗收:Apple Silicon、磁碟 ≥ 256GB、macOS 版本滿足官方 Hermes 路徑;關閉自動休眠。
安裝 Hermes:執行官方一鍵腳本並 hermes init;確認資料目錄路徑與備份策略。
7×24 冒煙:綁 IM 通道,下發含 5+ 工具呼叫的長任務;24h 後檢查 Skill 是否寫入、FTS5 可檢索。
備份與退租預案:定期匯出資料目錄;退租前遷移 USER.md / Skill 並按流程擦除磁碟。
curl -fsSL https://get.hermes-agent.org | bash hermes init hermes model
提示:生產節點請固定 Hermes 版本並寫入變更單;hermes model 切換後端後觀察 24h 記憶體曲線,再開第二個 IM 通道。
Hermes Agent 的護城河是三層記憶在磁碟上複利,但兌現複利需要 Gateway 7×24、FTS5 索引健康、足夠統一記憶體跑完 5+ 工具鏈。樹莓派與 VPS 能完成安裝,卻在本機推理或 IO 穩定性上削薄 Skill 曲線;Mac Mini M4 月租把硬體變成可預測服務,讓你把精力放在 USER.md 打磨與通道擴展,而非風扇與換代。
若你已決定用專用 Apple Silicon 節點跑 Hermes,下一步是算清套餐與交付節奏:VpsMesh Mac Mini M4 月租提供 16/32GB 統一記憶體、遠端接入與退租資料清除流程。價格見 Mac Mini M4 租用價格,部署與 FAQ 見 雲端說明中心,線上選配見 訂購頁。
注意:勿在同一週末同時遷移宿主、重建 FTS5 索引、清空 Skill 目錄——三角變更無法二分定位。先遷機並驗證 24h Gateway 穩定,再動模型路由或批量匯入記憶。
不會。已寫入磁碟的 Skill Documents、USER.md、MEMORY.md 及 SQLite FTS5 索引檔案會保留;僅當前工作階段短期上下文中斷。關鍵是 Gateway 與資料目錄在7×24 穩定節點上,並做好定期備份——頻繁休眠的筆電仍會讓通道與長任務鏈斷檔。
Gateway 閒置約 200–400MB;本機 Ollama 跑 Hermes-3 8B 時峰值常達 8–12GB。通道 + cron + 本機推理並行時,16GB 易觸頂,32GB 統一記憶體更穩妥。套餐對照見 價格頁。