Speicherschichten · Neustart-Mythos · Pi/VPS/M4-Matrix · 24-Monats-TCO · Sechs-Schritte-Runbook
Hermes Agent wird schlauer durch dreistufiges Gedächtnis auf der Festplatte: USER.md mit ca. 1.375 Zeichen für Ihr Profil, MEMORY.md mit etwa 2.200 Zeichen pro Skill-Eintrag, SQLite FTS5 für Volltextsuche — Skills schreiben erst nach 5+ Tool-Aufrufen in abgeschlossenen Tasks. Dieser datengetriebene Leitfaden erklärt, warum 24/7-Betrieb Pflicht ist, vergleicht Pi / VPS / Mac Mini M4 mit gemessenen RAM-Bändern, quantifiziert 24-Monats-TCO und liefert ein Sechs-Schritte-Runbook. Neustart löscht persistierte Daten nicht; ein schlafender Gateway bricht Kanäle und die Skill-Schleife ab — für DACH-Teams relevant auch unter DSGVO, wenn Präferenzen in Skills landen.
Viele sehen Nous Research Hermes Agent als Chat-Shell mit Tools. Die Persistenzschicht ist tiefer. Stufe eins: Sitzungskontext — Tool-Status und Reasoning-Trace im RAM, weg nach Neustart. Stufe zwei: Skill Documents, Markdown-Playbooks nach komplexen Tasks, dedupliziert ins Datenverzeichnis — Community-Größe ca. 2.200 Zeichen pro Eintrag. Stufe drei: persistentes Nutzermodell in USER.md mit Budget ca. 1.375 Zeichen.
Hermes indexiert Skills und Memory mit SQLite FTS5. Vor Context-Injection wird lokal gesucht — spart Tokens und macht Disk-IO und Index-Gesundheit messbar wichtig. Skill-Extraktion erst ab fünf Tool-Aufrufen pro Task; der Host darf mittendrin nicht suspendieren.
| Speicher-Komponente | Typische Größe / Mechanismus | Überlebt Neustart? | Bedeutung für 24/7 |
|---|---|---|---|
| Sitzungskontext | Aktueller Turn und Tool-State | Nein — Reconnect nötig | Gateway live halten; IM-Webhook-Timeout bricht Ketten |
| USER.md | ~1.375 Zeichen Nutzerprofil | Ja — auf Disk | Host-Migration = Datenverzeichnis; Sleep bremst Profil-Iteration |
| MEMORY.md / Skills | ~2.200 Zeichen pro Eintrag | Ja — auf Disk | FTS5 wächst mit Writes; Backup Pflicht |
| SQLite FTS5 | Lokaler Volltextindex | Ja — DB-Datei | Disk-Jitter oder VPS-IO-Caps erhöhen Latenz messbar |
Neustart ≠ Speicher-Wipe gilt nur für bereits geflushte Schichten. Kanal-UX, cron und laufende 5+-Tool-Ketten brechen trotzdem. Subjektive 30-Tage-Erfahrung: 30 Tage Hermes im Betrieb; hier Architektur und Ressourcenrechnung.
Alles weg nach Reboot annehmen: Skills und USER.md liegen im Datenverzeichnis — ohne Backup fühlt Host-Wechsel wie Amnesie.
5+-Tool-Gate ignorieren: Kurz-Chats werden keine Skills; Sleep mid-Task = nie fertige Extraktion.
FTS5 als Blackbox: Korrupte Indizes oder volle Platte → „geschrieben, nicht auffindbar“ — Datenverzeichnis-Größe monitoren.
USER.md nicht trimmen: 1.375-Zeichen-Budget endlich; ungepflegtes Profil verwässert Gewichte.
Gateway vom Modell trennen: Toter Gateway + live Cloud-Backend = IM-Ausfall — 24/7 heißt ganze Kette.
Hermes ist ein Always-on Agent: 20+ Kanäle (Telegram, Discord, Slack …) per Webhook am Gateway; cron weckt Subtasks; Honcho aktualisiert das Nutzermodell im Hintergrund. Fällt ein Glied aus: verpasste Callbacks, Queue-Backlog, verzögerte Skill-Writes — subjektiv wöchentlich neuer Assistent, obwohl Skill-Dateien wachsen.
24/7 matcht die Zeitachse der drei Schichten. Session will Millisekunden; Skills brauchen 5+-Tool-Runways; Nutzermodell compoundiert über Wochen. Laptop-Sleep, NAS-Offline, VPS-Nachbar-IO flachen die Kurve. Für EU-Teams: Skill-Inhalte können personenbezogene Präferenzen enthalten — DSGVO verlangt dokumentierte Aufbewahrung, Zugriffskontrolle und Löschung bei Vertragsende; ein dedizierter Miet-Host mit Wipe-Runbook reduziert Audit-Risiko gegenüber unklarem Heimgerät-Backup.
Speicher compoundiert auf Disk, aber das Gefühl, schlauer zu werden, kommt von einem Gateway ohne Schichtwechsel — das ist der messbare Unterschied zwischen 24/7 und „manchmal an“.
Derselbe curl -fsSL https://get.hermes-agent.org | bash — Unterschiede in Memory-Bandbreite, Disk-IO, macOS-Pfad. Tabelle: qualitativer Benchmark für Gateway + Telegram + lokales Ollama Hermes-3 8B (intermittierend). Zahlen variieren mit Quantisierung und Kanalzahl — Review-tauglich, nicht Lab-Zertifikat.
| Host-Option | Idle-RAM | Peak-RAM | CPU / Leistung | Hermes-Fit |
|---|---|---|---|---|
| Raspberry Pi 5 · 8GB | ≈1,5 GB System-Headroom | Gateway allein ≈4 GB; lokales 8B nicht praktikabel | ARM low-power; SD-IO-Engpass | Nur API-Gateway; schwaches Skill-Compounding |
| Linux VPS 4C8G | ≈5 GB nutzbar | API-Modus ≈6 GB; Docker +2 GB | Shared vCPU; IOPS-Cap | SSH remote; kein macOS — Skills teils awkward |
| Mac Mini M4 16GB | ≈9 GB nutzbar | Lokal 8B + Kanäle ≈14–15 GB an Decke | Idle ≈12 W; Burst 25–35 W | Native macOS; ein Kanal + lokal am Limit |
| Mac Mini M4 32GB | ≈22 GB nutzbar | 8B + Dual-Kanal + cron ≈18–20 GB | Gleiches Silizium, weniger Druck | Produktionsempfehlung — FTS5-Wachstum eingeplant |
Unified Memory (UMA) reduziert CPU↔GPU-Kopien bei lokaler Inferenz; macOS hält Install-Pfad kurz. Pi spart Watt, hält kein 8B; VPS spart Miete, verliert Zeit an RTT und IO — ab GB-Größe für Skills/FTS5 zählt stabile Disk-Latenz mehr als erste Monatsersparnis.
Entscheidungsobjekt: Gesamtkosten für 24 Monate Memory-Compounding — Hardware, Strom, Ops-Stunden, Upgrade-Angst, Migration. Miete = CapEx → OpEx; für produktive Skill- und Kanal-Last oft geringere Entscheidungskosten.
| TCO-Dimension (24 Monate) | Kauf M4 16GB | Miete M4 32GB |
|---|---|---|
| Hardware-Cashflow | Upfront + Steuer; Abschreibung selbst modellieren | Fix × 24 Monate; RAM-Upgrade ohne Neukauf |
| Strom (24/7) | ≈12–35 W × 24 h × 730 Tage | In Service enthalten |
| Ops-Stunden | Garantie, OS, Ausfall selbst | Hardware-Tausch; Remote-KVM |
| Hermes-Datenassets | USER.md / Skills / FTS5 an eine Maschine | Backup → Restore; Wipe bei Rückgabe |
| DSGVO / Sicherheit | Eigenes Lösch- und Backup-Regime | Vertragliche Löschung + dokumentierter Export |
| Upgrade-Risiko | M-Serie lockt Zweitkauf | Neue Spec am Vertragsende |
| Opportunitätskosten | Hardware-Recherche statt Skill-Politur | Fokus auf Agent-Workflows |
RAM wählen: API-only + ein Kanal: 16 GB; lokales Hermes-3 + Multi-Kanal + cron: 32 GB.
Bestellen & Zugang: Lease-ID, Remote-Pfad; MDM für Teams klären.
Abnahme: Apple Silicon, ≥256 GB Disk, macOS für Hermes-Pfad; Sleep aus.
Install: Offizieller One-Liner, dann hermes init; Datenverzeichnis und Backup-Policy fixieren.
24/7-Smoke: IM binden, Long-Task mit 5+ Tools; nach 24 h Skill-Write und FTS5-Retrieval prüfen.
Backup & Offboarding: Datenverzeichnis exportieren; vor Lease-Ende migrieren und gemäß DSGVO sicher löschen.
curl -fsSL https://get.hermes-agent.org | bash hermes init hermes model
Hinweis: Hermes-Version pinnen; nach hermes model-Wechsel 24-h-RAM-Kurve beobachten, dann zweiten IM-Kanal.
Hermes’ Moat ist dreistufiges Gedächtnis auf Disk — realisiert nur mit 24/7-Gateway, gesundem FTS5 und genug UMA für 5+-Tool-Ketten. Pi und VPS installieren, dünner Skill-Kurve; Mac Mini M4-Miete macht Hardware zu planbarem Service.
VpsMesh Mac Mini M4 Monatsmiete: 16/32 GB UMA, Remote-Zugang, Wipe bei Rückgabe. Preise: Mac Mini M4 Mietpreise, Hilfe: Hilfezentrum, Bestellung: Bestellseite.
Achtung: Host-Migration, FTS5-Rebuild und Skill-Wipe nicht am selben Wochenende — erst 24 h Gateway-stabil, dann Routing oder Bulk-Import.
Nein. Skill Documents, USER.md, MEMORY.md und SQLite FTS5 auf Disk bleiben; nur Sitzungskontext bricht ab. Entscheidend: 24/7-stabiler Host mit Backup — schlafendes Notebook droppt Kanäle und lange Tool-Ketten.
Gateway idle ca. 200–400 MB; lokales Ollama Hermes-3 8B oft 8–12 GB Peak. Parallel Kanäle + cron: 16 GB knapp — 32 GB Unified Memory sicherer. Vergleich: Preisseite.
Bei Skill-Compounding statt Hardware-Asset wandelt Miete Abschreibung in fixe OpEx — oft günstiger als Kauf plus Ops. Bestellen: Bestellseite; Setup: Hilfezentrum.