Inférence Ollama locale · Matrice coûts API cloud · Runbook en 6 étapes · Symptômes Gateway
Vous souhaitez faire tourner OpenClaw avec Ollama pour réduire la facture API cloud, mais le Gateway tombe après la mise en veille du portable, le premier ollama pull expire, ou l’agent signale un contexte insuffisant. Ce guide s’adresse aux équipes qui déploient ollama launch openclaw et un plan de contrôle 24/7 sur un Mac distant : d’abord une matrice de décision API cloud vs inférence locale, puis un runbook en six étapes pour l’installation et l’acceptation, enfin un tableau des symptômes Gateway. À lire avec la checklist d’installation Gateway et le routage multi-modèles.
En 2026, l’intégration officielle Ollama regroupe via ollama launch openclaw le pull de modèle, le Gateway et l’onboarding OpenClaw. En production, l’échec vient rarement d’OpenClaw manquant, mais du mélange du service modèle et du Gateway/canal 24/7 sur un portable qui dort. La documentation exige Node 22.14+ (parfois 24) ; les longs dialogues demandent un contexte suffisant (souvent 64k tokens, p. ex. qwen3-coder, glm-4.7). Avec un modèle 8k, le health check Gateway peut rester vert alors que les Skills débordent après plusieurs tours d’outils.
Confondre pull réussi et bout-en-bout : les poids sur disque ne valident qu’Ollama ; exécutez aussi openclaw gateway status et un Skill minimal.
Mauvais choix de contexte : modèle trop petit pour économiser la RAM ; vérifiez le contexte sur la fiche Ollama.
Veille du portable et Gateway coupé : l’inférence locale économise l’API, mais callbacks et heartbeat exigent 24/7 — voir persistance cloud Mac.
Mélanger paramètres Docker et bare metal : en conteneur, mem_limit ; en natif, cache disque et mémoire unifiée — arbres de panne distincts.
Routing cloud par défaut inchangé : Ollama actif mais modèle cloud coûteux en config — définir le provider et un plafond, voir routage multi-modèles.
Ces cinq points comme portes de release orientent le diagnostic vers Gateway, canal et backend modèle. La section suivante propose une matrice API cloud, OpenRouter et Ollama local.
Trois critères : confidentialité et périmètre des clés, facture mensuelle prévisible, exploitation 24/7. Tableau pour revue en une page ; ensuite un seul runbook.
| Backend | Profil | Coût principal | Lien OpenClaw |
|---|---|---|---|
| API cloud directe | Faible latence, facturation au token | Rotation des clés, pics, conformité régionale | Chemin par défaut ; paliers et plafonds |
| OpenRouter | Essais multi-modèles, bascule rapide | Toujours à l’usage ; dépendance tierce | Repli cloud avec Ollama local primaire |
| Ollama local | Données sur le nœud | RAM/disque, durée de pull, modèles 64k+ | ollama launch openclaw ou modèle manuel |
| Mac distant + Ollama | Inférence locale et canaux 24/7 | Loyer mensuel + runbook | Co-localiser Gateway et Ollama |
Réduire l’API exige de basculer réellement le défaut vers Ollama et un contexte adapté aux longs échanges — sinon ce n’est qu’un processus de plus.
Exemple : ollama launch openclaw --model qwen3-coder et openclaw onboard --install-daemon. Hybride : Ollama principal, API cloud en secours documenté dans le ticket de changement.
Ordre aligné sur la checklist d’installation Gateway : prouver Ollama et le modèle, puis le plan de contrôle OpenClaw et les canaux. Coller chaque sortie dans le ticket.
Installer Ollama : sur le Mac cible, version 0.17+, puis ollama --version et ollama list ; API en local (souvent 11434).
Pull d’un modèle à contexte suffisant : p. ex. ollama pull qwen3-coder ; noter disque et durée pour la capacité.
Intégration OpenClaw : ollama launch openclaw --config, puis ollama launch openclaw ; ou install.sh et provider Ollama manuel.
Onboard et daemon : openclaw onboard --install-daemon, Ollama par défaut ; openclaw gateway status pour le port de contrôle (p. ex. 18789).
Skill minimal : commande courte sans navigateur et openclaw logs --follow ; en cas d’échec, ne pas modifier modèle et canal ensemble.
Smoke canal (optionnel) : Telegram/Slack via durcissement multi-canal, indépendamment du backend modèle.
ollama --version ollama pull qwen3-coder ollama launch openclaw --config ollama launch openclaw --model qwen3-coder openclaw onboard --install-daemon openclaw gateway status openclaw doctor --fix
Conseil : le premier pull sur lien lent ou transfrontalier timeoute souvent — utiliser screen ou systemd sur le nœud distant pour éviter des couches partielles après coupure SSH.
| Symptôme | Vérifier d’abord | Action type |
|---|---|---|
| ollama pull bloqué ou timeout | Espace disque, réseau, SSH | Session persistante ; nettoyer ~/.ollama si besoin |
| Gateway vert, réponses tronquées | Contexte modèle, tours | Modèle 64k+ ; repli cloud ou paliers de routage |
| openclaw n’atteint pas Ollama | 11434, pare-feu, URL provider | curl API Ollama ; aligner loopback et config |
| doctor : version Node | node -v | 22.14+ ou 24 ; ne pas confondre avec Node conteneur |
| Canal sans callback | Reachabilité, proxy WS | Guide d’installation d’abord ; modèle ensuite |
~/.ollama/models ; modèles 7B–30B peuvent occuper des dizaines de Go — prévoir sur le Mac distant.Attention : ne pas faire tourner clé API cloud, tag Ollama et webhook canal dans le même changement — pas de bisection propre.
Le portable convient pour valider ollama launch openclaw et les fiches modèle. Dès que des canaux IM, un cron nocturne ou un Gateway partagé entrent en jeu, veille et NAT menacent le SLA. Migrer cache Ollama, données Gateway et daemon vers un Mac distant prévisible coûte moins que de réveiller la machine en boucle.
Un VPS générique sans mémoire unifiée produit souvent inférence lente, OOM et IO instable sur gros modèles ; un Mac cloud Apple Silicon convient mieux à Ollama. Pour beaucoup d’équipes, essai local puis persistance distante est plus sûr qu’un achat maximal immédiat. Pour capacité dédiée, canaux stables et changements auditables, la location cloud Mac Mini VpsMesh est en général le meilleur choix : Ollama et Gateway sur le même nœud. Tarifs, Centre d’aide, Commander.
Oui. Les canaux IM sont gérés par le Gateway, indépendamment d’Ollama ou du cloud. Il faut un Gateway 24/7 et des webhooks joignables — durcissement multi-canal, persistance Mac cloud.
D’abord un modèle Ollama 64k+ et des chaînes d’outils plus courtes par session ; si overflow persiste, routage multi-modèles pour paliers et repli cloud — ne pas modifier les deux en même temps.
Migrer Ollama et Gateway vers un Mac distant avec daemon — guide 24/7. Commander : page de commande, tarifs : tarifs location.