Pourquoi Hermes Agent doit tourner 24 h/24 : mémoire à trois niveaux et consommation réelle sur Mac Mini M4 (2026)

Trois niveaux de mémoire · redémarrage ≠ amnésie · matrice Pi/VPS/M4 · TCO 24 mois · runbook en six étapes

Hermes Agent mémoire à trois niveaux et Mac Mini M4 disponible 24 h/24

Hermes Agent gagne en pertinence grâce à une mémoire à trois niveaux qui s'accumule sur disque : USER.md d'environ 1 375 caractères pour votre profil, MEMORY.md plafonné à 2 200 caractères par Skill, SQLite FTS5 pour la recherche plein texte — l'écriture des Skills n'intervient qu'après 5 appels d'outils ou plus dans une tâche terminée. Ce guide professionnel explique pourquoi l'architecture exige une disponibilité 24 h/24, compare Pi / VPS / Mac Mini M4 avec des fourchettes mesurées, cadre le TCO sur 24 mois et propose un runbook en six étapes. Un redémarrage n'efface pas la mémoire persistée ; un Gateway en veille interrompt les canaux et la boucle d'enrichissement des Skills.

01

Architecture à trois niveaux : USER.md, MEMORY.md et SQLite FTS5

Beaucoup voient Nous Research Hermes Agent comme une coquille de chat avec outils. La couche de persistance va plus loin. Niveau un : contexte de session — état des outils et trace de raisonnement en RAM, perdu au redémarrage. Niveau deux : Skill Documents, playbooks markdown générés après tâches complexes, dédupliqués dans le répertoire de données — environ 2 200 caractères par entrée selon la communauté. Niveau trois : modèle utilisateur persistant via USER.md, budget d'environ 1 375 caractères.

Hermes indexe Skills et mémoire avec SQLite FTS5. Avant injection de contexte, l'agent interroge l'index local — moins coûteux en tokens et raison pour laquelle I/O disque et santé de l'index comptent autant que le calcul. Seuil d'extraction : au moins cinq appels d'outils par tâche ; l'hôte ne doit pas se mettre en veille en cours de chaîne.

Composant mémoireTaille / mécanisme typiqueSurvit au reboot ?Enjeu 24 h/24
Contexte sessionTour courant et état outilsNon — reconnexion requiseGateway actif ; timeout webhook IM = chaîne rompue
USER.md~1 375 caractères profilOui — sur disqueMigration = copie data dir ; veille ralentit le profil
MEMORY.md / Skills~2 200 caractères par entréeOui — sur disqueFTS5 croît ; sauvegardes obligatoires
SQLite FTS5Index plein texte localOui — fichier DBJitter disque ou plafond IOPS VPS = latence

Redémarrage ≠ effacement mémoire ne vaut que pour les couches déjà flushées. UX canal, cron et chaînes 5+ outils en vol cassent quand même. Récit subjectif sur 30 jours : 30 jours avec Hermes ; cet article reste sur l'architecture et le dimensionnement.

  1. 01

    Croire que tout disparaît au reboot : Skills et USER.md restent dans le data directory — sans backup, changement d'hôte = amnésie ressentie.

  2. 02

    Ignorer le seuil 5+ outils : chats courts ne deviennent jamais Skills ; veille mid-task = extraction inachevée.

  3. 03

    Traiter FTS5 comme boîte noire : index corrompu ou disque plein → « écrit mais introuvable » — surveiller taille et santé SQLite.

  4. 04

    Ne pas élaguer USER.md : budget 1 375 caractères fini ; profil non entretenu dilue les poids de préférence.

  5. 05

    Séparer Gateway et modèle : Gateway mort + backend cloud actif = IM coupé — 24 h/24 signifie toute la chaîne.

02

Pourquoi Hermes Agent doit tourner 24 h/24 : Gateway, canaux et accumulation de Skills

Hermes est conçu comme agent always-on : plus de 20 canaux (Telegram, Discord, Slack…) via webhooks au Gateway ; cron réveille des sous-tâches ; Honcho met à jour le modèle utilisateur en arrière-plan. Si un maillon tombe : callbacks manqués, file d'attente, écritures Skill retardées — subjectivement un nouvel assistant chaque semaine alors que les fichiers Skills grossissent.

La disponibilité 24 h/24 aligne l'axe temporel des trois niveaux. Session exige des millisecondes ; Skills des chaînes longues à 5+ outils ; modèle utilisateur s'accumule sur des semaines. Portable fermé, NAS intermittent, VPS throttlé — la courbe d'accumulation s'aplatit. Un hôte dédié transforme survie processus, réseau stable et disques prévisibles en SLA plutôt qu'en pari sur la prise secteur.

La mémoire s'accumule sur disque, mais la sensation de progrès vient d'un Gateway qui ne manque jamais son service — c'est l'écart mesurable entre 24 h/24 et « je lance quand j'y pense ».

Critères d'acceptation minimum pour un nœud always-on

  • Processus : Gateway + backend 30 jours sans restart manuel (mises à jour OS avec fenêtre de changement).
  • Canaux : IM au choix, tâche dispatchée, pas de timeout en 24 h ; cron à l'heure.
  • Données : Data directory inscriptible, FTS5 interrogé ; backup hebdomadaire restaurable pour USER.md et Skills.
  • Ressources : ≥20 % de marge RAM pour éviter OOM sur le Gateway.
03

Raspberry Pi, VPS, Mac Mini M4 : matrice de consommation réelle

Le même curl -fsSL https://get.hermes-agent.org | bash se comporte différemment selon l'hôte — bande passante mémoire, I/O disque, chemin macOS natif. Tableau : fourchette qualitative pour Gateway + Telegram + Ollama local Hermes-3 8B (inférence intermittente). Chiffres variables selon quantification et nombre de canaux — décision en revue, pas certification labo.

Option hôteRAM au reposRAM picCPU / puissanceAdéquation Hermes
Raspberry Pi 5 · 8 Go≈1,5 Go marge systèmeGateway seul ≈4 Go ; 8B local non viableARM basse conso ; goulot SDGateway API seul ; faible accumulation Skills
VPS Linux 4C8G≈5 Go utilisablesMode API ≈6 Go ; Docker +2 GovCPU partagé ; IOPS plafonnésSSH distant ; pas macOS — Skills parfois awkward
Mac Mini M4 16 Go≈9 Go utilisables8B local + canaux ≈14–15 Go au plafondRepos ≈12 W ; burst 25–35 WmacOS natif ; un canal + local à la limite
Mac Mini M4 32 Go≈22 Go utilisables8B + dual canal + cron ≈18–20 GoMême silicium, moins de pressionChoix production — marge FTS5 et Skills

Mémoire unifiée (UMA) réduit les copies CPU↔GPU en inférence locale ; macOS raccourcit installateur et Ollama. Pi économise les watts, pas un 8B ; VPS économise le loyer, perd du temps en RTT et IO — au-delà du gigaoctet pour Skills/FTS5, la latence disque stable prime sur quelques euros au premier mois.

04

TCO 24 mois : acheter un Mac Mini M4 ou louer au mois

L'enjeu n'est pas « Apple ou non » — c'est le coût total pour faire fructifier la mémoire sur 24 mois : matériel, électricité, ops, anxiété upgrade, migration. La location convertit CapEx en OpEx ; pour des équipes en charge Skills et canaux, souvent moins de coût de décision que achat plus support interne.

Dimension TCO (24 mois)Achat M4 16 GoLocation M4 32 Go
Trésorerie matérielUpfront + taxe ; amortissement à modéliserForfait mensuel × 24 ; upgrade RAM sans remplacer la machine
Électricité (24 h/24)≈12–35 W × 24 h × 730 joursInclus dans le service
Heures opsGarantie, OS, pannes à votre chargeSwap matériel ; KVM distant
Actifs HermesUSER.md / Skills / FTS5 liés à une machineBackup → restore ; effacement au retour
Risque upgradeCadence M-series tente un second achatNouvelle spec en fin de contrat
Coût d'opportunitéRecherche matériel vs polish SkillsFocus workflows agent et canaux

Runbook en six étapes : de la location au smoke test FTS5

  1. 01

    Choisir la RAM : API seule + un canal : 16 Go ; Hermes-3 local + multi-canaux + cron : 32 Go.

  2. 02

    Commander & accès : ID bail, chemin distant ; MDM pour équipes.

  3. 03

    Acceptation : Apple Silicon, disque ≥256 Go, macOS compatible Hermes ; veille désactivée.

  4. 04

    Installer Hermes : One-liner officiel, puis hermes init ; data directory et politique backup.

  5. 05

    Smoke 24 h/24 : Lier IM, tâche longue 5+ outils ; après 24 h vérifier Skill et retrieval FTS5.

  6. 06

    Backup & sortie : Exporter data directory ; avant fin de bail migrer USER.md / Skills et effacer selon procédure.

bash · macOS
curl -fsSL https://get.hermes-agent.org | bash
hermes init
hermes model

Conseil : Épingler la version Hermes en production ; après changement hermes model, observer la courbe RAM 24 h avant un second canal IM.

05

Paramètres citables et conclusion

  • Budget USER.md : environ 1 375 caractères — élaguer si dépassement.
  • Plafond MEMORY.md / Skill : environ 2 200 caractères avec dédup.
  • Déclencheur Skill : ≥5 appels d'outils par tâche.
  • Moteur recherche : SQLite FTS5 local — planifier disque et backup.
  • RAM mesurée : Gateway repos 200–400 Mo ; Ollama Hermes-3 8B pics 8–12 Go ; production 32 Go UMA.
  • Puissance : M4 24 h/24 repos ≈12 W, burst 25–35 W.

L'avantage de Hermes Agent est la mémoire à trois niveaux sur disque — à condition de Gateway 24 h/24, FTS5 sain et UMA suffisante pour chaînes 5+ outils. Pi et VPS passent l'install mais amincissent la courbe Skills ; la location Mac Mini M4 transforme le matériel en service prévisible.

Location mensuelle Mac Mini M4 VpsMesh : 16/32 Go UMA, accès distant, effacement au retour. Tarifs : tarifs Mac Mini M4, déploiement : centre d'aide, commande : page commander.

Attention : Ne pas migrer l'hôte, reconstruire FTS5 et vider Skills le même week-end — trois changements simultanés empêchent le diagnostic. Prouver 24 h de Gateway stable, puis routing ou import mémoire.

FAQ

Questions fréquentes

Non. Skill Documents, USER.md, MEMORY.md et index SQLite FTS5 sur disque persistent ; seul le contexte de session est perdu. Il faut un hôte stable 24 h/24 avec sauvegardes — portable en veille coupe canaux et longues chaînes d'outils.

Gateway au repos ≈200–400 Mo ; Ollama Hermes-3 8B local pics 8–12 Go. Canaux + cron en parallèle : 16 Go serré — 32 Go mémoire unifiée plus sûr. Comparer : page tarifs.

Si accumulation Skills et uptime canaux priment sur le silicium, la location 24 mois transforme amortissement en OpEx fixe — souvent moins cher qu'achat plus ops. Commander : page commander ; déploiement : centre d'aide.