Trois niveaux de mémoire · redémarrage ≠ amnésie · matrice Pi/VPS/M4 · TCO 24 mois · runbook en six étapes
Hermes Agent gagne en pertinence grâce à une mémoire à trois niveaux qui s'accumule sur disque : USER.md d'environ 1 375 caractères pour votre profil, MEMORY.md plafonné à 2 200 caractères par Skill, SQLite FTS5 pour la recherche plein texte — l'écriture des Skills n'intervient qu'après 5 appels d'outils ou plus dans une tâche terminée. Ce guide professionnel explique pourquoi l'architecture exige une disponibilité 24 h/24, compare Pi / VPS / Mac Mini M4 avec des fourchettes mesurées, cadre le TCO sur 24 mois et propose un runbook en six étapes. Un redémarrage n'efface pas la mémoire persistée ; un Gateway en veille interrompt les canaux et la boucle d'enrichissement des Skills.
Beaucoup voient Nous Research Hermes Agent comme une coquille de chat avec outils. La couche de persistance va plus loin. Niveau un : contexte de session — état des outils et trace de raisonnement en RAM, perdu au redémarrage. Niveau deux : Skill Documents, playbooks markdown générés après tâches complexes, dédupliqués dans le répertoire de données — environ 2 200 caractères par entrée selon la communauté. Niveau trois : modèle utilisateur persistant via USER.md, budget d'environ 1 375 caractères.
Hermes indexe Skills et mémoire avec SQLite FTS5. Avant injection de contexte, l'agent interroge l'index local — moins coûteux en tokens et raison pour laquelle I/O disque et santé de l'index comptent autant que le calcul. Seuil d'extraction : au moins cinq appels d'outils par tâche ; l'hôte ne doit pas se mettre en veille en cours de chaîne.
| Composant mémoire | Taille / mécanisme typique | Survit au reboot ? | Enjeu 24 h/24 |
|---|---|---|---|
| Contexte session | Tour courant et état outils | Non — reconnexion requise | Gateway actif ; timeout webhook IM = chaîne rompue |
| USER.md | ~1 375 caractères profil | Oui — sur disque | Migration = copie data dir ; veille ralentit le profil |
| MEMORY.md / Skills | ~2 200 caractères par entrée | Oui — sur disque | FTS5 croît ; sauvegardes obligatoires |
| SQLite FTS5 | Index plein texte local | Oui — fichier DB | Jitter disque ou plafond IOPS VPS = latence |
Redémarrage ≠ effacement mémoire ne vaut que pour les couches déjà flushées. UX canal, cron et chaînes 5+ outils en vol cassent quand même. Récit subjectif sur 30 jours : 30 jours avec Hermes ; cet article reste sur l'architecture et le dimensionnement.
Croire que tout disparaît au reboot : Skills et USER.md restent dans le data directory — sans backup, changement d'hôte = amnésie ressentie.
Ignorer le seuil 5+ outils : chats courts ne deviennent jamais Skills ; veille mid-task = extraction inachevée.
Traiter FTS5 comme boîte noire : index corrompu ou disque plein → « écrit mais introuvable » — surveiller taille et santé SQLite.
Ne pas élaguer USER.md : budget 1 375 caractères fini ; profil non entretenu dilue les poids de préférence.
Séparer Gateway et modèle : Gateway mort + backend cloud actif = IM coupé — 24 h/24 signifie toute la chaîne.
Hermes est conçu comme agent always-on : plus de 20 canaux (Telegram, Discord, Slack…) via webhooks au Gateway ; cron réveille des sous-tâches ; Honcho met à jour le modèle utilisateur en arrière-plan. Si un maillon tombe : callbacks manqués, file d'attente, écritures Skill retardées — subjectivement un nouvel assistant chaque semaine alors que les fichiers Skills grossissent.
La disponibilité 24 h/24 aligne l'axe temporel des trois niveaux. Session exige des millisecondes ; Skills des chaînes longues à 5+ outils ; modèle utilisateur s'accumule sur des semaines. Portable fermé, NAS intermittent, VPS throttlé — la courbe d'accumulation s'aplatit. Un hôte dédié transforme survie processus, réseau stable et disques prévisibles en SLA plutôt qu'en pari sur la prise secteur.
La mémoire s'accumule sur disque, mais la sensation de progrès vient d'un Gateway qui ne manque jamais son service — c'est l'écart mesurable entre 24 h/24 et « je lance quand j'y pense ».
Le même curl -fsSL https://get.hermes-agent.org | bash se comporte différemment selon l'hôte — bande passante mémoire, I/O disque, chemin macOS natif. Tableau : fourchette qualitative pour Gateway + Telegram + Ollama local Hermes-3 8B (inférence intermittente). Chiffres variables selon quantification et nombre de canaux — décision en revue, pas certification labo.
| Option hôte | RAM au repos | RAM pic | CPU / puissance | Adéquation Hermes |
|---|---|---|---|---|
| Raspberry Pi 5 · 8 Go | ≈1,5 Go marge système | Gateway seul ≈4 Go ; 8B local non viable | ARM basse conso ; goulot SD | Gateway API seul ; faible accumulation Skills |
| VPS Linux 4C8G | ≈5 Go utilisables | Mode API ≈6 Go ; Docker +2 Go | vCPU partagé ; IOPS plafonnés | SSH distant ; pas macOS — Skills parfois awkward |
| Mac Mini M4 16 Go | ≈9 Go utilisables | 8B local + canaux ≈14–15 Go au plafond | Repos ≈12 W ; burst 25–35 W | macOS natif ; un canal + local à la limite |
| Mac Mini M4 32 Go | ≈22 Go utilisables | 8B + dual canal + cron ≈18–20 Go | Même silicium, moins de pression | Choix production — marge FTS5 et Skills |
Mémoire unifiée (UMA) réduit les copies CPU↔GPU en inférence locale ; macOS raccourcit installateur et Ollama. Pi économise les watts, pas un 8B ; VPS économise le loyer, perd du temps en RTT et IO — au-delà du gigaoctet pour Skills/FTS5, la latence disque stable prime sur quelques euros au premier mois.
L'enjeu n'est pas « Apple ou non » — c'est le coût total pour faire fructifier la mémoire sur 24 mois : matériel, électricité, ops, anxiété upgrade, migration. La location convertit CapEx en OpEx ; pour des équipes en charge Skills et canaux, souvent moins de coût de décision que achat plus support interne.
| Dimension TCO (24 mois) | Achat M4 16 Go | Location M4 32 Go |
|---|---|---|
| Trésorerie matériel | Upfront + taxe ; amortissement à modéliser | Forfait mensuel × 24 ; upgrade RAM sans remplacer la machine |
| Électricité (24 h/24) | ≈12–35 W × 24 h × 730 jours | Inclus dans le service |
| Heures ops | Garantie, OS, pannes à votre charge | Swap matériel ; KVM distant |
| Actifs Hermes | USER.md / Skills / FTS5 liés à une machine | Backup → restore ; effacement au retour |
| Risque upgrade | Cadence M-series tente un second achat | Nouvelle spec en fin de contrat |
| Coût d'opportunité | Recherche matériel vs polish Skills | Focus workflows agent et canaux |
Choisir la RAM : API seule + un canal : 16 Go ; Hermes-3 local + multi-canaux + cron : 32 Go.
Commander & accès : ID bail, chemin distant ; MDM pour équipes.
Acceptation : Apple Silicon, disque ≥256 Go, macOS compatible Hermes ; veille désactivée.
Installer Hermes : One-liner officiel, puis hermes init ; data directory et politique backup.
Smoke 24 h/24 : Lier IM, tâche longue 5+ outils ; après 24 h vérifier Skill et retrieval FTS5.
Backup & sortie : Exporter data directory ; avant fin de bail migrer USER.md / Skills et effacer selon procédure.
curl -fsSL https://get.hermes-agent.org | bash hermes init hermes model
Conseil : Épingler la version Hermes en production ; après changement hermes model, observer la courbe RAM 24 h avant un second canal IM.
L'avantage de Hermes Agent est la mémoire à trois niveaux sur disque — à condition de Gateway 24 h/24, FTS5 sain et UMA suffisante pour chaînes 5+ outils. Pi et VPS passent l'install mais amincissent la courbe Skills ; la location Mac Mini M4 transforme le matériel en service prévisible.
Location mensuelle Mac Mini M4 VpsMesh : 16/32 Go UMA, accès distant, effacement au retour. Tarifs : tarifs Mac Mini M4, déploiement : centre d'aide, commande : page commander.
Attention : Ne pas migrer l'hôte, reconstruire FTS5 et vider Skills le même week-end — trois changements simultanés empêchent le diagnostic. Prouver 24 h de Gateway stable, puis routing ou import mémoire.
Non. Skill Documents, USER.md, MEMORY.md et index SQLite FTS5 sur disque persistent ; seul le contexte de session est perdu. Il faut un hôte stable 24 h/24 avec sauvegardes — portable en veille coupe canaux et longues chaînes d'outils.
Gateway au repos ≈200–400 Mo ; Ollama Hermes-3 8B local pics 8–12 Go. Canaux + cron en parallèle : 16 Go serré — 32 Go mémoire unifiée plus sûr. Comparer : page tarifs.
Si accumulation Skills et uptime canaux priment sur le silicium, la location 24 mois transforme amortissement en OpEx fixe — souvent moins cher qu'achat plus ops. Commander : page commander ; déploiement : centre d'aide.