Ollama 本地推理 · 云 API 成本矩阵 · 六步 Runbook · Gateway 症状表
2026 年 Ollama 官方集成路径提供 ollama launch openclaw,把模型拉取、Gateway 与 OpenClaw 向导串成一条命令;但生产里最常见的失败并非「没装 OpenClaw」,而是把模型服务与通道/Gateway 常驻混在同一台会休眠的笔记本上。Ollama 博客与 OpenClaw 安装文档均要求 Node 22.14+(部分环境推荐 24),且 OpenClaw 对长对话依赖足够上下文的模型(社区建议至少 64k token 量级,如 qwen3-coder、glm-4.7 等)。若你只选了 8k 上下文的轻量模型,Gateway 健康检查仍可能通过,但 Skill 会在多轮工具调用后溢出。
把 pull 成功当成端到端通过:模型权重落盘只说明 Ollama 就绪;还需 openclaw gateway status 与一次最小 Skill 试跑。
上下文选型错误:为省显存选过小模型,长会话或浏览器类 Skill 触发截断;应先在 Ollama 侧验证模型卡片标注的 context。
笔记本休眠断 Gateway:本地推理省 API 费,但通道回调与 heartbeat 需要 24/7;与 云端常驻文 的痛点一致。
与 Docker 路径混参:容器内 OpenClaw 要谈 mem_limit;Ollama 裸机要谈磁盘缓存与统一内存,故障树勿合并。
仍全开云路由:已接 Ollama 却在配置里保留高价默认模型,账单不降反升;需显式改 provider 并做成本上限,见 多模型路由文。
把五条写成发布门禁后,排障会从「猜模型坏了」收敛到「Gateway / 通道 / 模型后端」三层。下一节用矩阵帮你在云 API、OpenRouter 与 Ollama 本地之间签字选型。
选型看三件事:隐私与密钥边界、可预测的月账单、运维面是否 24/7。下表用于评审会一页纸决策;选定后只走对应 Runbook。
| 后端 | 适合谁 | 主要代价 | 与 OpenClaw 衔接 |
|---|---|---|---|
| 直连云 API | 要低延迟、接受按 token 计费 | 密钥轮换、账单尖峰、区域合规 | 默认路径;配合路由分档与上限 |
| OpenRouter 聚合 | 要多模型试错、快速切换 | 仍按量;依赖第三方可用性 | 适合与 Ollama 做「本地主、云备」 |
| Ollama 本地 | 要数据不出机、可接受算力成本前移 | RAM/磁盘、模型 pull 时间、需 64k+ 模型 | ollama launch openclaw 或手动指定模型 |
| 远程 Mac + Ollama | 要本地推理 + 通道 24/7 | 节点月租 + 运维 Runbook | Gateway 与 Ollama 同机或同区域,减少跨区延迟 |
省 API 费的前提是真的把默认模型切到 Ollama,并为长对话选对上下文;否则只是多装了一个进程。
Ollama 官方示例支持 ollama launch openclaw --model qwen3-coder 一类参数;OpenClaw 侧仍应运行 openclaw onboard --install-daemon 安装守护进程。混合部署时建议「Ollama 主路由 + 云 API 紧急回退」,回退策略写入变更单而非口头约定。
下列顺序与 Gateway 安装排障清单 衔接:先证明 Ollama 与模型,再证明 OpenClaw 控制面与通道。每步输出粘贴到工单。
安装 Ollama:在目标 Mac 安装 Ollama 0.17+,执行 ollama --version 与 ollama list,确认服务监听本机 API(默认 11434,以环境为准)。
拉取满足上下文的模型:例如 ollama pull qwen3-coder 或团队批准的 glm 系列;记录磁盘占用与 pull 耗时,写入容量规划。
启动 OpenClaw 集成:执行 ollama launch openclaw --config 预检,再 ollama launch openclaw;或按官方 install.sh 装 Node 栈后手动对接 Ollama provider。
onboard 与守护进程:运行 openclaw onboard --install-daemon,选择 Ollama 为默认模型后端;用 openclaw gateway status 确认 18789 类控制端口(以 status 输出为准)。
最小 Skill 试跑:执行一条不依赖浏览器的短指令(如读取状态或 echo),同时 openclaw logs --follow;失败则禁止同时改模型与通道配置。
通道冒烟(可选):若接 Telegram/Slack,按 多通道加固清单 做回调可达性;与模型后端解耦验收。
ollama --version ollama pull qwen3-coder ollama launch openclaw --config ollama launch openclaw --model qwen3-coder openclaw onboard --install-daemon openclaw gateway status openclaw doctor --fix
提示:首次 pull 在跨境或慢链路上易超时,应在远程节点用 screen 或 systemd 保活拉取,避免 SSH 断开导致半成品。
| 症状 | 先查 | 常见动作 |
|---|---|---|
| ollama pull 卡住或超时 | 磁盘余量、网络、是否 SSH 断线 | 用保活会话重拉;清理 ~/.ollama 损坏层后重试 |
| Gateway 绿但回复截断 | 模型 context、对话轮数 | 换 64k+ 模型;长任务改云备或分档路由 |
| openclaw 连不上 Ollama | 11434 监听、防火墙、provider URL | 本机 curl Ollama API;对齐 loopback 与配置项 |
| doctor 报 Node 版本 | node -v | 升到 22.14+ 或文档推荐 24;勿与容器内 Node 混用 |
| 通道无回调 | 公网可达、反代 WS | 先读安装排障文,勿先换模型 |
~/.ollama/models;远程 Mac 规划磁盘时要单独计入, 7B~30B 级模型可达数十 GB。注意:勿在同一变更单里同时旋转云 API Key、Ollama 模型 tag 与通道 webhook;三角变更无法二分回滚。
笔记本路径适合验证 ollama launch openclaw 与模型卡片;当 OpenClaw 要接 IM 通道、夜间 cron 或团队共用 Gateway 时,休眠与网络 NAT 会成为 SLA 杀手。此时把 Ollama 缓存目录、Gateway 数据目录与守护进程一并迁到同规格、可预期的远程 Mac,比反复唤醒本机更便宜。
纯自建 VPS(无统一内存优化)跑大模型常出现推理慢、OOM 与磁盘 IO 抖动;Mac 云端节点在 Apple Silicon 与内存带宽上更贴合本地推理场景。对个人开发者,「本机试验 + 远程常驻」双阶段通常比一步到位买最高配更稳。对需要独占算力、通道稳定与可审计变更的小团队,VpsMesh 的 Mac Mini 云端租赁通常是更优解:便于把 Ollama 与 Gateway 放在同一租约节点,并与 Mac Mesh 协作叙事对齐;价格见 价格页,部署路径见 帮助中心。