Локальный инференс Ollama · Матрица cloud API · 6-шаговый runbook · Симптомы Gateway
Хотите гонять OpenClaw на Ollama, чтобы не кормить cloud API по токенам — а на практике Gateway отваливается после сна ноута, первый ollama pull уходит в timeout, агент орёт «мало контекста». Плейбук для тех, кто выкатывает ollama launch openclaw и control plane 24/7 на удалённом Mac: сначала матрица cloud API vs локальный инференс, потом шестишаговый runbook установки и приёмки, в конце таблица симптомов по Gateway/Ollama. Крест-чтение: install + gateway doctor, multi-model routing.
В 2026 официальный путь Ollama упаковывает в ollama launch openclaw pull весов, подъём Gateway и onboarding OpenClaw. В проде падают не из‑за «не поставили OpenClaw», а потому что сервис модели и каналы/Gateway 24/7 сидят на ноуте, который уходит в сон. Доки требуют Node 22.14+ (иногда 24); длинные диалоги требуют нормальный context window — в комьюнити ориентир 64k токенов (qwen3-coder, glm-4.7). На 8k-модели healthcheck Gateway может быть зелёным, а Skill после пары tool-call раундов упрётся в overflow контекста — классика, не «баг модели».
Pull ≠ e2e green: веса на диске — только «Ollama жив»; дальше openclaw gateway status и минимальный прогон Skill.
Неверный context: сжали модель ради RAM — режутся длинные сессии и browser-Skills; смотрите context в карточке Ollama, не в голове.
Сон ноута рубит Gateway: локальный инференс экономит API, но callback каналов и heartbeat хотят 24/7 — см. постоянный cloud Mac.
Мешают Docker и bare metal: в контейнере — mem_limit; на голом железе — кэш на диске и unified memory; не склеивайте fault tree.
Cloud routing остаётся default: Ollama крутится, в конфиге всё ещё дорогая cloud-модель — явно переключите provider и лимиты, multi-model routing.
Пять release-gates переводят дебаг с «модель сломалась» на три слоя: Gateway, канал, backend модели. Дальше — матрица cloud API / OpenRouter / Ollama local.
Три оси: граница данных и ключей, предсказуемый месячный чек, эксплуатация 24/7. Таблица — одна страница для ревью; после выбора — один runbook, без «и то и это в проде».
| Backend | Кому заходит | Цена | Стыковка с OpenClaw |
|---|---|---|---|
| Прямой cloud API | Нужна низкая latency, ок pay-per-token | Ротация ключей, spikes, регион | Дефолт; tiers routing + caps |
| OpenRouter | A/B моделей, быстрый switch | Всё ещё metered; uptime третьей стороны | Cloud fallback к Ollama primary |
| Ollama local | Данные не уезжают с узла | RAM/диск, время pull, модели 64k+ | ollama launch openclaw или ручной tag |
| Удалённый Mac + Ollama | Локальный инференс + каналы 24/7 | Аренда узла + runbook | Co-locate Gateway и Ollama |
Экономия на API начинается, когда default реально на Ollama и context window не врёт — иначе вы просто подняли ещё один процесс.
Пример: ollama launch openclaw --model qwen3-coder + openclaw onboard --install-daemon. Гибрид: Ollama primary, cloud API emergency — в change ticket, не в чате «на словах».
Порядок стыкуется с чеклистом install Gateway: сначала доказываем Ollama и модель, потом control plane OpenClaw и каналы. Вывод каждого шага — в тикет, иначе потом не бисектите.
Ставим Ollama: на целевом Mac 0.17+, ollama --version, ollama list; API на localhost (часто 11434).
Pull модели с нормальным context: например ollama pull qwen3-coder; зафиксируйте диск и ETA pull в capacity plan.
Интеграция OpenClaw: ollama launch openclaw --config, затем ollama launch openclaw; или install.sh + ручной Ollama provider.
Onboard + daemon: openclaw onboard --install-daemon, Ollama как default backend; openclaw gateway status — control port (часто 18789).
Минимальный Skill: короткая команда без браузера + openclaw logs --follow; при фейле не крутите модель и канал в одном diff.
Smoke канала (опционально): Telegram/Slack по hardening multi-channel, отдельно от backend модели.
ollama --version ollama pull qwen3-coder ollama launch openclaw --config ollama launch openclaw --model qwen3-coder openclaw onboard --install-daemon openclaw gateway status openclaw doctor --fix
Совет: первый pull через медленный или трансграничный линк часто в timeout — на удалённом узле гоните через screen или systemd, чтобы обрыв SSH не оставил полуслой весов.
| Симптом | Сначала смотрим | Типовой фикс |
|---|---|---|
| ollama pull завис / timeout | Свободный диск, сеть, SSH | Сессия с keepalive; почистить ~/.ollama при битых слоях |
| Gateway зелёный, ответы режутся | Context модели, число раундов | Модель 64k+; cloud fallback или routing tiers |
| openclaw не видит Ollama | 11434, firewall, provider URL | curl в API Ollama; выровнять loopback и config |
| doctor ругается на Node | node -v | 22.14+ или 24; не путать с Node внутри контейнера |
| Канал без callback | Доступность, WS proxy | Сначала install guide; модель — потом |
~/.ollama/models; 7B–30B легко съедают десятки GB — закладывайте отдельной строкой в план диска удалённого Mac.Не делайте так: в одном change крутите cloud API key, tag модели Ollama и webhook канала — треугольный diff не бисектится.
Ноут — песочница для ollama launch openclaw и карточек моделей. Как только появляются IM-каналы, ночной cron или общий Gateway, sleep и NAT становятся убийцами SLA. Переносите cache Ollama, data dir Gateway и daemon на предсказуемый удалённый Mac — дешевле, чем будить ноут по расписанию.
Самосборный VPS без unified memory на больших моделях часто даёт медленный инференс, OOM и дисковый jitter; cloud Mac на Apple Silicon ближе к профилю Ollama. Для многих команд схема локальный эксперимент → удалённый 24/7 стабильнее, чем сразу максимальная конфигурация. Нужны выделенные ресурсы, стабильные каналы и аудируемые изменения — аренда cloud Mac Mini у VpsMesh обычно оптимальна: Ollama и Gateway на одном lease-узле, в линию с Mac Mesh. Цены аренды, Центр помощи, Оформить заказ.
Да. IM-каналы живут в Gateway, backend Ollama или cloud — без разницы. Нужны Gateway 24/7 и доступные webhooks — hardening multi-channel, cloud Mac 24/7.
Сначала Ollama-модель 64k+ и более плоские tool-цепочки в сессии; если overflow остаётся — multi-model routing для tiers и cloud fallback; не меняйте оба слоя в одном PR.
Перенесите Ollama и Gateway на удалённый Mac с daemon — гайд 24/7. Заказ: оформить, тарифы: цены аренды.