28.9T 週調用量 · 中美格局逆轉 · DeepSeek 矩陣稱霸 · Token vs 美元雙重真相 · 六步週榜追蹤
若你在 MMLU 榜單與生產體驗之間反覆橫跳,卻想知道「2026 年到底誰在真正被呼叫」,OpenRouter Rankings 的按週 Token 吞吐量比任何 Benchmark 更誠實:截至 2026 年 5 月 24 日那一週,全球週調用量達 28.9 兆 Token(連續五週上漲),中國模型以 9.223T 連續四週超越美國,DeepSeek 三款模型合計 5.74T 稱霸廠商榜首。本文面向做模型路由與成本控管的開發者與技術負責人,交付資料來源說明、當週 Top 10 解讀、Token 份額 vs 美元收入的雙重真相、a16z 基準測試反轉發現與六步週榜追蹤 Runbook,並說明長期跑 Agent 時 Mac Mini M4 月租 為何仍是穩定宿主。
OpenRouter 是全球最大的中立 AI 模型 API 聚合平台,接入 300+ 模型、覆蓋 60+ 供應商,超 800 萬 使用者、每月約 100 兆 Token 流量。其公開排行榜(openrouter.ai/rankings)按7 天滾動 Token 吞吐量統計,輸入與輸出均計入——這是開發者「用錢投票」後的真實體溫計,而非廠商簡報上的雷達圖。
一年前 OpenRouter 週處理量約 2.4 兆,如今單週已達 28.9 兆,成長約 12 倍。Token 調用量已從技術指標升級為商業戰場晴雨表:投資人用它評估 AI 商業化進度,開發者用它選擇「不押寶單一廠商」的路由策略。
Benchmark 可被「刷分」優化:MMLU、HumanEval 高分不代表 Agent 工作流中 XML/JSON 工具呼叫穩定,更不代表 30 分鐘自主編碼不迷路。
調用量反映落地意願:開發者願為某模型持續付費並燒算力,說明其在穩定性、回應速度、性價比上通過了生產檢驗。
週維度捕捉趨勢:按週統計比月度快照更靈敏,DeepSeek V4-Flash 當週環比 +66% 這類訊號在月榜裡會被平滑掉。
免費模型扭曲感知:Owl Alpha 等零單價模型會放大實驗流量,閱讀週榜須同時看Token 份額與美元收入份額。
程式設計已成最大單一用途:OpenRouter + a16z 聯合報告(覆蓋 100 兆 Token 匿名元資料)顯示,程式任務占比從 2025 年初 11% 飆升至超 50%——榜單前列模型幾乎都在為 Agent 與編碼優化。
不是誰最聰明,而是誰最被呼叫,才推動 AI 真正落地——帳單上的數字,比任何評測榜單都誠實。
下表彙總 OpenRouter 公開資料(統計週期:按週 7 天滾動,截止 2026 年 5 月 24 日)。資料交叉參照每日經濟新聞(2026-05-25)、OpenRouter 官方榜單與 MACCOME 同期解讀。
| 指標 | 資料 | 環比變化 |
|---|---|---|
| 全球週調用量 | 28.9 兆 Token | +7.4%(連續五週上漲) |
| 中國模型週調用量 | 9.223 兆 Token | +19.89% |
| 美國模型週調用量 | 4.93 兆 Token | +16.27% |
| 中美排名 | 中國連續四週超越美國 | 穩居全球首位 |
| 時間節點 | 中國模型流量占比 |
|---|---|
| 2025 年初 | < 2% |
| 2026 年 2 月 | 首次超越美國 |
| 2026 年 5 月 | ~45%+,連續四週超美 |
口徑說明:OpenRouter 按模型歸屬廠商統計地域份額;DeepSeek、騰訊、MiniMax、StepFun 等中國團隊模型計入中國側,Anthropic、Google、xAI 等計入美國側。
以下為 2026 年 5 月 18–24 日按週 Token 量排序的前十模型。DeepSeek 旗下 V4-Flash、V4-Pro、V3.2 同時進入前九,系列合計 5.74T(環比 +25.9%),連續兩週超越 Anthropic 與 Google 位居廠商第一。前週排名第 6 的 Kimi K2.6 當週跌出前十。
| 排名 | 模型 | 廠商 | 週 Token 量 | 環比 | 特點 |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3.43T | +66% | Agent 工作流首選,極低價格 |
| 2 | 騰訊 Hy3 Preview | Tencent | 3.07T | +16% | 限免結束後仍高成長 |
| 3 | Claude Sonnet 4.6 | Anthropic | 1.35T | — | 百萬上下文,企業程式主力 |
| 4 | DeepSeek-V3.2 | DeepSeek | 1.31T | — | 低價長尾,角色扮演活躍 |
| 5 | Owl Alpha | OpenRouter | 1.15T | +29% | 免費 Agent 特化,百萬上下文 |
| 6 | Gemini 3 Flash Preview | 1.06T | — | 多模態,學術/醫療場景 | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1.00T | — | 矩陣旗艦(系列合計 5.74T) |
| 8 | MiniMax M2.7 | MiniMax | 806B | — | 長上下文性價比之選 |
| 9 | Grok 4.1 Fast | xAI | 721B | — | 2M 上下文,法律場景強勢 |
| 10 | Step 3.5 Flash | StepFun | 673B | — | 快速低價,批次處理場景 |
只看 Token 調用量會遺漏定價差異帶來的商業現實。Anthropic 呈現典型的溢價悖論:Token 份額約 12%(一年前為 25%,持續下滑),美元收入份額卻約 46%——企業級使用者仍為 Claude 付高價,但流量主導權已拱手相讓。Claude Opus 4.6 月收入約 2500 萬美元,Token 量卻只有 DeepSeek 的零頭。
| 市場分層 | 代表模型 | Token 特徵 | 收入特徵 |
|---|---|---|---|
| 高價值·低流量 | Claude Opus 系列 | 份額下滑 | 企業複雜推理,付費能力強 |
| 性價比·中流量 | Google Gemini Flash | 穩定成長 | 多模態、學術場景 |
| 極低價·高流量 | DeepSeek / MiniMax / StepFun | 份額快速擴張 | Agent、程式、批次主導 |
OpenRouter + a16z《2025 AI 使用報告》還揭示了一個反直覺發現:模型的基準測試分數與其實際市場份額幾乎呈反比。開發者更關注推理成本而非極限能力;Agent 工作流更依賴穩定性與 API 回應速度。這與週榜上 DeepSeek、Hy3 霸榜而部分 Benchmark 冠軍缺席前十的現象完全吻合。
週榜每週更新,路由策略也應按週迭代。以下 Runbook 適用於 Claude Code、Cursor、OpenClaw 或自研 Gateway,目標是把「榜單洞察」變成可執行的設定變更。
固定每週一開啟 Rankings:造訪 openrouter.ai/rankings,記錄全球總量、中美份額與 Top 10 變動,存檔截圖供團隊複盤。
區分 Token 與美元維度:同時查看 Token 份額與 Revenue 份額,避免把免費模型(Owl Alpha)的高流量誤判為「生產首選」。
按任務場景對應模型:Agent / 批次 → DeepSeek-V4-Flash;企業複雜推理 → Claude Opus;多模態 → Gemini Flash;關注新進榜模型(Hy3、Owl Alpha)作為下一爆款訊號。
用固定 Prompt 集回歸:每週對同一 Issue 子集跑編碼任務,記錄工具呼叫失敗率,對比週榜變化是否影響你的實際體驗。
更新路由 JSON 與預算熔斷:Flash 檔放寬並發,Opus 檔設月度硬頂;主路由失敗時走降級鏈(Sonnet → V4-Flash → 人工佇列)。
綁定 7×24 宿主驗證路由:路由層可在任意雲;若 Agent 依賴 macOS(Claude Code、OpenClaw),將守護程序部署到月租 Mac Mini,避免筆電合蓋中斷長跑任務。
{
"weekly_review": "2026-05-24",
"routes": {
"agent_batch": "openrouter/deepseek/deepseek-v4-flash",
"enterprise": "openrouter/anthropic/claude-sonnet-4.6",
"complex_reasoning": "openrouter/anthropic/claude-opus-4.6",
"multimodal": "openrouter/google/gemini-3-flash-preview",
"experiment": "openrouter/owl-alpha"
},
"fallback": ["enterprise", "agent_batch"],
"monthly_cap_usd": 800
}
撰寫內部 memo 或架構評審時,可直接引用以下經 OpenRouter 公開資料與媒體報導交叉驗證的資料點(統計週期:2026 年 5 月 18–24 日):
OpenRouter 解決的是推理供應商切換,卻無法替代程序守護、金鑰邊界與 Apple 工具鏈。許多團隊在 Flash 檔把 API 成本壓到極低,卻仍在筆電合蓋時遺失半夜的 Agent 執行;或把 OpenClaw 塞進 Linux VPS 後反覆遇到 Metal / Keychain / Xcode 缺失。與OpenRouter 趨勢選型指南、租用 Mac Mini 跑 OpenClaw同理:模型可按 Token 計價隨時換,宿主 uptime 卻是 OpEx 合約。對要把多模型路由當基礎設施、同時跑 iOS CI/CD 與跨夜 Agent 的團隊,VpsMesh Mac Mini M4 雲端租用通常是比個人筆電更穩的生產選擇。方案見 Mac Mini M4 租用價格,部署見 雲端說明中心。
週 Token 調用量反映開發者真實付費與生產流量,是「用錢投票」的市場溫度計;Benchmark 適合比較極限能力,但 OpenRouter + a16z 報告顯示二者常呈反比。重大選型應結合週榜趨勢與固定任務集私有回歸,並每月造訪 openrouter.ai/rankings 複核。
DeepSeek V4-Flash 單價極低(約 $0.10/$0.40 per M tokens),Agent 與批次可大規模呼叫,當週 3.43T 居首;Claude 單價高 30–50 倍,Token 份額低但美元收入份額仍約 46%。按場景選型而非盲目追最強,詳見 OpenRouter 趨勢選型指南。
不必須。純 OpenRouter API 可在 Linux 呼叫。若技術棧含 Claude Code、Xcode 或 OpenClaw 守護,Mac Mini M4 月租更省心。建議先租 1 個月驗證週榜路由與守護設定,方案見 Mac Mini M4 租用價格,下單見 訂購頁。