OpenRouter 最新模型週調用量排行:帳單數據不會說謊,誰才是真正的王者?

28.9T 週調用量 · 中美格局逆轉 · DeepSeek 矩陣稱霸 · Token vs 美元雙重真相 · 六步週榜追蹤

OpenRouter 週 Token 調用量排行與帳單數據解讀

若你在 MMLU 榜單與生產體驗之間反覆橫跳,卻想知道「2026 年到底誰在真正被呼叫」,OpenRouter Rankings按週 Token 吞吐量比任何 Benchmark 更誠實:截至 2026 年 5 月 24 日那一週,全球週調用量達 28.9 兆 Token(連續五週上漲),中國模型以 9.223T 連續四週超越美國,DeepSeek 三款模型合計 5.74T 稱霸廠商榜首。本文面向做模型路由與成本控管的開發者與技術負責人,交付資料來源說明當週 Top 10 解讀Token 份額 vs 美元收入的雙重真相a16z 基準測試反轉發現六步週榜追蹤 Runbook,並說明長期跑 Agent 時 Mac Mini M4 月租 為何仍是穩定宿主。

01

為什麼帳單數據比 Benchmark 排行榜更可信?五大認知陷阱

OpenRouter 是全球最大的中立 AI 模型 API 聚合平台,接入 300+ 模型、覆蓋 60+ 供應商,超 800 萬 使用者、每月約 100 兆 Token 流量。其公開排行榜(openrouter.ai/rankings)按7 天滾動 Token 吞吐量統計,輸入與輸出均計入——這是開發者「用錢投票」後的真實體溫計,而非廠商簡報上的雷達圖。

一年前 OpenRouter 週處理量約 2.4 兆,如今單週已達 28.9 兆,成長約 12 倍。Token 調用量已從技術指標升級為商業戰場晴雨表:投資人用它評估 AI 商業化進度,開發者用它選擇「不押寶單一廠商」的路由策略。

  1. 01

    Benchmark 可被「刷分」優化:MMLU、HumanEval 高分不代表 Agent 工作流中 XML/JSON 工具呼叫穩定,更不代表 30 分鐘自主編碼不迷路。

  2. 02

    調用量反映落地意願:開發者願為某模型持續付費並燒算力,說明其在穩定性、回應速度、性價比上通過了生產檢驗。

  3. 03

    週維度捕捉趨勢:按週統計比月度快照更靈敏,DeepSeek V4-Flash 當週環比 +66% 這類訊號在月榜裡會被平滑掉。

  4. 04

    免費模型扭曲感知:Owl Alpha 等零單價模型會放大實驗流量,閱讀週榜須同時看Token 份額美元收入份額

  5. 05

    程式設計已成最大單一用途:OpenRouter + a16z 聯合報告(覆蓋 100 兆 Token 匿名元資料)顯示,程式任務占比從 2025 年初 11% 飆升至超 50%——榜單前列模型幾乎都在為 Agent 與編碼優化。

不是誰最聰明,而是誰最被呼叫,才推動 AI 真正落地——帳單上的數字,比任何評測榜單都誠實。

02

2026 年 5 月 18–24 日:28.9T 全球週調用量與中美格局

下表彙總 OpenRouter 公開資料(統計週期:按週 7 天滾動,截止 2026 年 5 月 24 日)。資料交叉參照每日經濟新聞(2026-05-25)、OpenRouter 官方榜單與 MACCOME 同期解讀。

指標資料環比變化
全球週調用量28.9 兆 Token+7.4%(連續五週上漲)
中國模型週調用量9.223 兆 Token+19.89%
美國模型週調用量4.93 兆 Token+16.27%
中美排名中國連續四週超越美國穩居全球首位

中國模型崛起時間線

時間節點中國模型流量占比
2025 年初< 2%
2026 年 2 月首次超越美國
2026 年 5 月~45%+,連續四週超美
i

口徑說明:OpenRouter 按模型歸屬廠商統計地域份額;DeepSeek、騰訊、MiniMax、StepFun 等中國團隊模型計入中國側,Anthropic、Google、xAI 等計入美國側。

03

當週模型調用量 Top 10:DeepSeek 矩陣三席入榜

以下為 2026 年 5 月 18–24 日按週 Token 量排序的前十模型。DeepSeek 旗下 V4-Flash、V4-Pro、V3.2 同時進入前九,系列合計 5.74T(環比 +25.9%),連續兩週超越 Anthropic 與 Google 位居廠商第一。前週排名第 6 的 Kimi K2.6 當週跌出前十。

排名模型廠商週 Token 量環比特點
1DeepSeek-V4-FlashDeepSeek3.43T+66%Agent 工作流首選,極低價格
2騰訊 Hy3 PreviewTencent3.07T+16%限免結束後仍高成長
3Claude Sonnet 4.6Anthropic1.35T百萬上下文,企業程式主力
4DeepSeek-V3.2DeepSeek1.31T低價長尾,角色扮演活躍
5Owl AlphaOpenRouter1.15T+29%免費 Agent 特化,百萬上下文
6Gemini 3 Flash PreviewGoogle1.06T多模態,學術/醫療場景
7DeepSeek-V4-ProDeepSeek1.00T矩陣旗艦(系列合計 5.74T)
8MiniMax M2.7MiniMax806B長上下文性價比之選
9Grok 4.1 FastxAI721B2M 上下文,法律場景強勢
10Step 3.5 FlashStepFun673B快速低價,批次處理場景
04

廠商格局:Token 份額 vs 美元收入的「雙重真相」

只看 Token 調用量會遺漏定價差異帶來的商業現實。Anthropic 呈現典型的溢價悖論:Token 份額約 12%(一年前為 25%,持續下滑),美元收入份額卻約 46%——企業級使用者仍為 Claude 付高價,但流量主導權已拱手相讓。Claude Opus 4.6 月收入約 2500 萬美元,Token 量卻只有 DeepSeek 的零頭。

市場分層代表模型Token 特徵收入特徵
高價值·低流量Claude Opus 系列份額下滑企業複雜推理,付費能力強
性價比·中流量Google Gemini Flash穩定成長多模態、學術場景
極低價·高流量DeepSeek / MiniMax / StepFun份額快速擴張Agent、程式、批次主導

OpenRouter + a16z《2025 AI 使用報告》還揭示了一個反直覺發現:模型的基準測試分數與其實際市場份額幾乎呈反比。開發者更關注推理成本而非極限能力;Agent 工作流更依賴穩定性與 API 回應速度。這與週榜上 DeepSeek、Hy3 霸榜而部分 Benchmark 冠軍缺席前十的現象完全吻合。

05

六步 Runbook:按週追蹤 OpenRouter 排行並調整模型路由

週榜每週更新,路由策略也應按週迭代。以下 Runbook 適用於 Claude Code、Cursor、OpenClaw 或自研 Gateway,目標是把「榜單洞察」變成可執行的設定變更。

  1. 01

    固定每週一開啟 Rankings:造訪 openrouter.ai/rankings,記錄全球總量、中美份額與 Top 10 變動,存檔截圖供團隊複盤。

  2. 02

    區分 Token 與美元維度:同時查看 Token 份額與 Revenue 份額,避免把免費模型(Owl Alpha)的高流量誤判為「生產首選」。

  3. 03

    按任務場景對應模型:Agent / 批次 → DeepSeek-V4-Flash;企業複雜推理 → Claude Opus;多模態 → Gemini Flash;關注新進榜模型(Hy3、Owl Alpha)作為下一爆款訊號。

  4. 04

    用固定 Prompt 集回歸:每週對同一 Issue 子集跑編碼任務,記錄工具呼叫失敗率,對比週榜變化是否影響你的實際體驗。

  5. 05

    更新路由 JSON 與預算熔斷:Flash 檔放寬並發,Opus 檔設月度硬頂;主路由失敗時走降級鏈(Sonnet → V4-Flash → 人工佇列)。

  6. 06

    綁定 7×24 宿主驗證路由:路由層可在任意雲;若 Agent 依賴 macOS(Claude Code、OpenClaw),將守護程序部署到月租 Mac Mini,避免筆電合蓋中斷長跑任務。

json · 按週榜調整的多模型路由(概念設定)
{
  "weekly_review": "2026-05-24",
  "routes": {
    "agent_batch": "openrouter/deepseek/deepseek-v4-flash",
    "enterprise": "openrouter/anthropic/claude-sonnet-4.6",
    "complex_reasoning": "openrouter/anthropic/claude-opus-4.6",
    "multimodal": "openrouter/google/gemini-3-flash-preview",
    "experiment": "openrouter/owl-alpha"
  },
  "fallback": ["enterprise", "agent_batch"],
  "monthly_cap_usd": 800
}
06

可引用硬核資料與 Agent 宿主選擇

撰寫內部 memo 或架構評審時,可直接引用以下經 OpenRouter 公開資料與媒體報導交叉驗證的資料點(統計週期:2026 年 5 月 18–24 日):

  • 全球週調用量:28.9T Token,環比 +7.4%,連續五週上漲;一年前約 2.4T,成長約 12 倍/年
  • DeepSeek 矩陣:V4-Flash 3.43T + V4-Pro 1.00T + V3.2 1.31T = 系列合計 5.74T,廠商排名第一。
  • 程式任務占比:OpenRouter + a16z 報告:從 2025 年初 11% 升至超 50%,為最大單一用途類別。
  • Anthropic 溢價:Token 份額 ~12% vs 美元收入份額 ~46%;Opus 4.6 月收入約 2500 萬美元
  • 中國模型份額:2025 年初 <2% → 2026 年 5 月 ~45%+,連續四週超美。

OpenRouter 解決的是推理供應商切換,卻無法替代程序守護、金鑰邊界與 Apple 工具鏈。許多團隊在 Flash 檔把 API 成本壓到極低,卻仍在筆電合蓋時遺失半夜的 Agent 執行;或把 OpenClaw 塞進 Linux VPS 後反覆遇到 Metal / Keychain / Xcode 缺失。與OpenRouter 趨勢選型指南租用 Mac Mini 跑 OpenClaw同理:模型可按 Token 計價隨時換,宿主 uptime 卻是 OpEx 合約。對要把多模型路由當基礎設施、同時跑 iOS CI/CD 與跨夜 Agent 的團隊,VpsMesh Mac Mini M4 雲端租用通常是比個人筆電更穩的生產選擇。方案見 Mac Mini M4 租用價格,部署見 雲端說明中心

常見問題

讀者最常問的三個問題

Token 調用量反映開發者真實付費與生產流量,是「用錢投票」的市場溫度計;Benchmark 適合比較極限能力,但 OpenRouter + a16z 報告顯示二者常呈反比。重大選型應結合週榜趨勢與固定任務集私有回歸,並每月造訪 openrouter.ai/rankings 複核。

DeepSeek V4-Flash 單價極低(約 $0.10/$0.40 per M tokens),Agent 與批次可大規模呼叫,當週 3.43T 居首;Claude 單價高 30–50 倍,Token 份額低但美元收入份額仍約 46%。按場景選型而非盲目追最強,詳見 OpenRouter 趨勢選型指南

不必須。純 OpenRouter API 可在 Linux 呼叫。若技術棧含 Claude Code、Xcode 或 OpenClaw 守護,Mac Mini M4 月租更省心。建議先租 1 個月驗證週榜路由與守護設定,方案見 Mac Mini M4 租用價格,下單見 訂購頁