Ollama 本機推論 · 雲端 API 成本矩陣 · 六步 Runbook · Gateway 症狀表
2026 年 Ollama 官方整合路徑提供 ollama launch openclaw,把模型拉取、Gateway 與 OpenClaw 精靈串成一條指令;但正式環境最常見的失敗並非「沒裝 OpenClaw」,而是把模型服務與通道/Gateway 常駐混在同一台會休眠的筆電上。Ollama 部落格與 OpenClaw 安裝文件均要求 Node 22.14+(部分環境建議 24),且 OpenClaw 對長對話依賴足夠上下文的模型(社群建議至少 64k token 量級,如 qwen3-coder、glm-4.7 等)。若只選 8k 上下文的輕量模型,Gateway 健康檢查仍可能通過,但 Skill 會在多輪工具呼叫後溢位。
評審前請勿先判定「模型壞了」,應拆成後端、Gateway、通道三層。Ollama API 有回應,不代表 OpenClaw 控制面在 18789 類埠上穩定;反之 Gateway 綠燈但 provider 仍是雲端,帳單也不會下降。五條隱性成本寫進發布閘門後,變更才可稽核,也能避免在深夜同時調模型 tag 與 webhook 卻無法二分回滾。
把 pull 成功當端到端通過:權重落碟只代表 Ollama 就緒;還需 openclaw gateway status 與一次最小 Skill 試跑。
上下文選型錯誤:為省 VRAM 選過小模型,長會話或瀏覽器類 Skill 會截斷;應先在 Ollama 側查模型卡標註的 context。
筆電休眠斷 Gateway:本機推論省 API 費,但通道回呼與 heartbeat 需要 24/7;與 雲端常駐文 痛點一致。
與 Docker 路徑混參:容器內 OpenClaw 談 mem_limit;Ollama 裸機談磁碟快取與統一記憶體,故障樹勿合併。
仍全開雲端路由:已接 Ollama 卻在設定保留高價預設模型,帳單不降反升;需明確改 provider 並設成本上限,見 多模型路由文。
五條寫成發布閘門後,排障會從「猜模型壞了」收斂到「Gateway / 通道 / 模型後端」三層。下一節用矩陣協助你在雲端 API、OpenRouter 與 Ollama 本機之間簽字選型。
選型看三件事:隱私與金鑰邊界、可預測的月帳單、維運面是否 24/7。下表供評審一頁決策;選定後只走對應 Runbook。
| 後端 | 適合誰 | 主要代價 | 與 OpenClaw 銜接 |
|---|---|---|---|
| 直連雲端 API | 要低延遲、接受按 token 計費 | 金鑰輪替、帳單尖峰、區域法規 | 預設路徑;搭配路由分檔與上限 |
| OpenRouter 聚合 | 要多模型試錯、快速切換 | 仍按量;依賴第三方可用性 | 適合與 Ollama 做「本機主、雲端備」 |
| Ollama 本機 | 資料不出機、可接受算力成本前移 | RAM/磁碟、模型 pull 時間、需 64k+ 模型 | ollama launch openclaw 或手動指定模型 |
| 遠端 Mac + Ollama | 要本機推論 + 通道 24/7 | 節點月租 + 維運 Runbook | Gateway 與 Ollama 同機或同區域,減少跨區延遲 |
省 API 費的前提是真的把預設模型切到 Ollama,並為長對話選對上下文;否則只是多裝了一個行程。
Ollama 官方範例支援 ollama launch openclaw --model qwen3-coder 一類參數;OpenClaw 側仍應執行 openclaw onboard --install-daemon 安裝常駐程式。混合部署建議「Ollama 主路由 + 雲端 API 緊急回退」,回退策略寫入變更單而非口頭約定。
小團隊可先在本機試一週,每週記錄 token 帳單與 pull 失敗率;數值超過閾值再遷到遠端 Mac,決策較客觀。評審會上請把「預設 provider 是否已指向 Ollama」與「長對話模型 context 是否 ≥64k」寫進驗收清單,避免口頭宣稱已省 API 費卻無法在帳單上對照。
下列順序與 Gateway 安裝排障清單 銜接:先證明 Ollama 與模型,再證明 OpenClaw 控制面與通道。每步輸出貼到工單。
安裝 Ollama:在目標 Mac 安裝 Ollama 0.17+,執行 ollama --version 與 ollama list,確認服務監聽本機 API(預設 11434,以環境為準)。
拉取滿足上下文的模型:例如 ollama pull qwen3-coder 或團隊核准的 glm 系列;記錄磁碟占用與 pull 耗時,寫入容量規劃。
啟動 OpenClaw 整合:執行 ollama launch openclaw --config 預檢,再 ollama launch openclaw;或依官方 install.sh 裝 Node 堆疊後手動對接 Ollama provider。
onboard 與常駐:執行 openclaw onboard --install-daemon,選 Ollama 為預設模型後端;用 openclaw gateway status 確認 18789 類控制埠(以 status 輸出為準)。
最小 Skill 試跑:執行一條不依賴瀏覽器的短指令(如讀取狀態或 echo),同時 openclaw logs --follow;失敗則禁止同時改模型與通道設定。
通道冒煙(可選):若接 Telegram/Slack,依 多通道加固清單 做回呼可達性;與模型後端解耦驗收。
ollama --version ollama pull qwen3-coder ollama launch openclaw --config ollama launch openclaw --model qwen3-coder openclaw onboard --install-daemon openclaw gateway status openclaw doctor --fix
提示:首次 pull 在跨境或慢鏈路易逾時,應在遠端節點用 screen 或 systemd 保活拉取,避免 SSH 斷線導致半成品。
| 症狀 | 先查 | 常見動作 |
|---|---|---|
| ollama pull 卡住或逾時 | 磁碟餘量、網路、是否 SSH 斷線 | 用保活會話重拉;清理 ~/.ollama 損壞層後重試 |
| Gateway 綠但回覆截斷 | 模型 context、對話輪數 | 換 64k+ 模型;長任務改雲端備或分檔路由 |
| openclaw 連不上 Ollama | 11434 監聽、防火牆、provider URL | 本機 curl Ollama API;對齊 loopback 與設定項 |
| doctor 報 Node 版本 | node -v | 升到 22.14+ 或文件建議 24;勿與容器內 Node 混用 |
| 通道無回呼 | 公網可達、反代 WS | 先讀安裝排障文,勿先換模型 |
~/.ollama/models;遠端 Mac 規劃磁碟時要單獨計入,7B~30B 級模型可達數十 GB。注意:勿在同一變更單裡同時輪替雲端 API Key、Ollama 模型 tag 與通道 webhook;三角變更無法二分回滾。
筆電路徑適合驗證 ollama launch openclaw 與模型卡;當 OpenClaw 要接 IM 通道、夜間 cron 或團隊共用 Gateway 時,休眠與 NAT 會成為 SLA 殺手。此時把 Ollama 快取、Gateway 資料與常駐一併遷到同規格、可預期的遠端 Mac,比反覆喚醒本機更划算。
純自建 VPS(無統一記憶體最佳化)跑大模型常出現推論慢、OOM 與磁碟 IO 抖動;Mac 雲端節點在 Apple Silicon 與記憶體頻寬上更貼合本機推論。對個人開發者,「本機試驗 + 遠端常駐」雙階段通常比一步到位買最高配更穩。對需要獨占算力、通道穩定與可稽核變更的小團隊,VpsMesh 的 Mac Mini 雲端租用通常是較優解:便於把 Ollama 與 Gateway 放在同一租約節點,並與 Mac Mesh 協作敘事對齊;價格見 價格頁,部署路徑見 說明中心。
驗收後建議每週彙整 Gateway uptime、pull 成功率與月 token 帳單,僅在超過閾值時升規或增加雲端備援,避免過度配置。若團隊已使用 Mac Mesh 共享建置池,請把 Ollama 模型目錄大小納入磁碟水位規劃,與 DerivedData 清理 Runbook 一併管理。