Quelle consommation RAM pour Hermes Agent sur Mac Mini M4 ?

Gateway au repos : 200–400 Mo ; Ollama Hermes-3 8B local : pics 8–12 Go. Avec canaux, cron et inférence locale, 16 Go devient serré — 32 Go de mémoire unifiée est plus sûr.

Location 24 mois ou achat pour un agent ?

Si vous optimisez l'accumulation de Skills et la stabilité des canaux, la location transforme amortissement et risque de cycle en OpEx prévisible — souvent plus rentable que achat plus ops pour petites équipes.

Pourquoi Hermes Agent doit tourner 24 h/24 : mémoire à trois niveaux et consommation réelle sur Mac Mini M4 (2026)

Q: Un redémarrage efface-t-il les Skills et préférences Hermes ?

Non. Skill Documents, USER.md, MEMORY.md et l'index SQLite FTS5 sur disque persistent ; seul le contexte de session est perdu. Il faut un hôte stable 24 h/24 avec sauvegardes — pas un portable en veille.

Architecture à trois niveaux : USER.md, MEMORY.md et SQLite FTS5

Beaucoup voient Nous Research Hermes Agent comme une coquille de chat avec outils. La couche de persistance va plus loin. Niveau un : contexte de session — état des outils et trace de raisonnement en RAM, perdu au redémarrage. Niveau deux : Skill Documents, playbooks markdown générés après tâches complexes, dédupliqués dans le répertoire de données — environ 2 200 caractères par entrée selon la communauté. Niveau trois : modèle utilisateur persistant via USER.md, budget d'environ 1 375 caractères.

Hermes indexe Skills et mémoire avec SQLite FTS5. Avant injection de contexte, l'agent interroge l'index local — moins coûteux en tokens et raison pour laquelle I/O disque et santé de l'index comptent autant que le calcul. Seuil d'extraction : au moins cinq appels d'outils par tâche ; l'hôte ne doit pas se mettre en veille en cours de chaîne.

Composant mémoire	Taille / mécanisme typique	Survit au reboot ?	Enjeu 24 h/24
Contexte session	Tour courant et état outils	Non — reconnexion requise	Gateway actif ; timeout webhook IM = chaîne rompue
USER.md	~1 375 caractères profil	Oui — sur disque	Migration = copie data dir ; veille ralentit le profil
MEMORY.md / Skills	~2 200 caractères par entrée	Oui — sur disque	FTS5 croît ; sauvegardes obligatoires
SQLite FTS5	Index plein texte local	Oui — fichier DB	Jitter disque ou plafond IOPS VPS = latence

Redémarrage ≠ effacement mémoire ne vaut que pour les couches déjà flushées. UX canal, cron et chaînes 5+ outils en vol cassent quand même. Récit subjectif sur 30 jours : 30 jours avec Hermes ; cet article reste sur l'architecture et le dimensionnement.

01
Croire que tout disparaît au reboot : Skills et USER.md restent dans le data directory — sans backup, changement d'hôte = amnésie ressentie.
02
Ignorer le seuil 5+ outils : chats courts ne deviennent jamais Skills ; veille mid-task = extraction inachevée.
03
Traiter FTS5 comme boîte noire : index corrompu ou disque plein → « écrit mais introuvable » — surveiller taille et santé SQLite.
04
Ne pas élaguer USER.md : budget 1 375 caractères fini ; profil non entretenu dilue les poids de préférence.
05
Séparer Gateway et modèle : Gateway mort + backend cloud actif = IM coupé — 24 h/24 signifie toute la chaîne.

Pourquoi Hermes Agent doit tourner 24 h/24 : Gateway, canaux et accumulation de Skills

Hermes est conçu comme agent always-on : plus de 20 canaux (Telegram, Discord, Slack…) via webhooks au Gateway ; cron réveille des sous-tâches ; Honcho met à jour le modèle utilisateur en arrière-plan. Si un maillon tombe : callbacks manqués, file d'attente, écritures Skill retardées — subjectivement un nouvel assistant chaque semaine alors que les fichiers Skills grossissent.

La disponibilité 24 h/24 aligne l'axe temporel des trois niveaux. Session exige des millisecondes ; Skills des chaînes longues à 5+ outils ; modèle utilisateur s'accumule sur des semaines. Portable fermé, NAS intermittent, VPS throttlé — la courbe d'accumulation s'aplatit. Un hôte dédié transforme survie processus, réseau stable et disques prévisibles en SLA plutôt qu'en pari sur la prise secteur.

La mémoire s'accumule sur disque, mais la sensation de progrès vient d'un Gateway qui ne manque jamais son service — c'est l'écart mesurable entre 24 h/24 et « je lance quand j'y pense ».

Critères d'acceptation minimum pour un nœud always-on

Processus : Gateway + backend 30 jours sans restart manuel (mises à jour OS avec fenêtre de changement).
Canaux : IM au choix, tâche dispatchée, pas de timeout en 24 h ; cron à l'heure.
Données : Data directory inscriptible, FTS5 interrogé ; backup hebdomadaire restaurable pour USER.md et Skills.
Ressources : ≥20 % de marge RAM pour éviter OOM sur le Gateway.

Raspberry Pi, VPS, Mac Mini M4 : matrice de consommation réelle

Le même curl -fsSL https://get.hermes-agent.org | bash se comporte différemment selon l'hôte — bande passante mémoire, I/O disque, chemin macOS natif. Tableau : fourchette qualitative pour Gateway + Telegram + Ollama local Hermes-3 8B (inférence intermittente). Chiffres variables selon quantification et nombre de canaux — décision en revue, pas certification labo.

Option hôte	RAM au repos	RAM pic	CPU / puissance	Adéquation Hermes
Raspberry Pi 5 · 8 Go	≈1,5 Go marge système	Gateway seul ≈4 Go ; 8B local non viable	ARM basse conso ; goulot SD	Gateway API seul ; faible accumulation Skills
VPS Linux 4C8G	≈5 Go utilisables	Mode API ≈6 Go ; Docker +2 Go	vCPU partagé ; IOPS plafonnés	SSH distant ; pas macOS — Skills parfois awkward
Mac Mini M4 16 Go	≈9 Go utilisables	8B local + canaux ≈14–15 Go au plafond	Repos ≈12 W ; burst 25–35 W	macOS natif ; un canal + local à la limite
Mac Mini M4 32 Go	≈22 Go utilisables	8B + dual canal + cron ≈18–20 Go	Même silicium, moins de pression	Choix production — marge FTS5 et Skills

Mémoire unifiée (UMA) réduit les copies CPU↔GPU en inférence locale ; macOS raccourcit installateur et Ollama. Pi économise les watts, pas un 8B ; VPS économise le loyer, perd du temps en RTT et IO — au-delà du gigaoctet pour Skills/FTS5, la latence disque stable prime sur quelques euros au premier mois.

TCO 24 mois : acheter un Mac Mini M4 ou louer au mois

L'enjeu n'est pas « Apple ou non » — c'est le coût total pour faire fructifier la mémoire sur 24 mois : matériel, électricité, ops, anxiété upgrade, migration. La location convertit CapEx en OpEx ; pour des équipes en charge Skills et canaux, souvent moins de coût de décision que achat plus support interne.

Dimension TCO (24 mois)	Achat M4 16 Go	Location M4 32 Go
Trésorerie matériel	Upfront + taxe ; amortissement à modéliser	Forfait mensuel × 24 ; upgrade RAM sans remplacer la machine
Électricité (24 h/24)	≈12–35 W × 24 h × 730 jours	Inclus dans le service
Heures ops	Garantie, OS, pannes à votre charge	Swap matériel ; KVM distant
Actifs Hermes	USER.md / Skills / FTS5 liés à une machine	Backup → restore ; effacement au retour
Risque upgrade	Cadence M-series tente un second achat	Nouvelle spec en fin de contrat
Coût d'opportunité	Recherche matériel vs polish Skills	Focus workflows agent et canaux

Runbook en six étapes : de la location au smoke test FTS5

01
Choisir la RAM : API seule + un canal : 16 Go ; Hermes-3 local + multi-canaux + cron : 32 Go.
02
Commander & accès : ID bail, chemin distant ; MDM pour équipes.
03
Acceptation : Apple Silicon, disque ≥256 Go, macOS compatible Hermes ; veille désactivée.
04
Installer Hermes : One-liner officiel, puis hermes init ; data directory et politique backup.
05
Smoke 24 h/24 : Lier IM, tâche longue 5+ outils ; après 24 h vérifier Skill et retrieval FTS5.
06
Backup & sortie : Exporter data directory ; avant fin de bail migrer USER.md / Skills et effacer selon procédure.

bash · macOS

curl -fsSL https://get.hermes-agent.org | bash
hermes init
hermes model

ℹ

Conseil : Épingler la version Hermes en production ; après changement hermes model, observer la courbe RAM 24 h avant un second canal IM.

Paramètres citables et conclusion

Budget USER.md : environ 1 375 caractères — élaguer si dépassement.
Plafond MEMORY.md / Skill : environ 2 200 caractères avec dédup.
Déclencheur Skill : ≥5 appels d'outils par tâche.
Moteur recherche : SQLite FTS5 local — planifier disque et backup.
RAM mesurée : Gateway repos 200–400 Mo ; Ollama Hermes-3 8B pics 8–12 Go ; production 32 Go UMA.
Puissance : M4 24 h/24 repos ≈12 W, burst 25–35 W.

L'avantage de Hermes Agent est la mémoire à trois niveaux sur disque — à condition de Gateway 24 h/24, FTS5 sain et UMA suffisante pour chaînes 5+ outils. Pi et VPS passent l'install mais amincissent la courbe Skills ; la location Mac Mini M4 transforme le matériel en service prévisible.

Location mensuelle Mac Mini M4 VpsMesh : 16/32 Go UMA, accès distant, effacement au retour. Tarifs : tarifs Mac Mini M4, déploiement : centre d'aide, commande : page commander.

⚠

Attention : Ne pas migrer l'hôte, reconstruire FTS5 et vider Skills le même week-end — trois changements simultanés empêchent le diagnostic. Prouver 24 h de Gateway stable, puis routing ou import mémoire.

FAQ

Questions fréquentes

Non. Skill Documents, USER.md, MEMORY.md et index SQLite FTS5 sur disque persistent ; seul le contexte de session est perdu. Il faut un hôte stable 24 h/24 avec sauvegardes — portable en veille coupe canaux et longues chaînes d'outils.

Gateway au repos ≈200–400 Mo ; Ollama Hermes-3 8B local pics 8–12 Go. Canaux + cron en parallèle : 16 Go serré — 32 Go mémoire unifiée plus sûr. Comparer : page tarifs.

Si accumulation Skills et uptime canaux priment sur le silicium, la location 24 mois transforme amortissement en OpEx fixe — souvent moins cher qu'achat plus ops. Commander : page commander ; déploiement : centre d'aide.