OpenRouter 最新模型周调用量排行:账单数据不会说谎,谁才是真正的王者?

28.9T 周调用量 · 中美格局逆转 · DeepSeek 矩阵称霸 · Token vs 美元双重真相 · 六步周榜追踪

OpenRouter 周 Token 调用量排行与账单数据解读

若你在 MMLU 榜单与生产体验之间反复横跳,却想知道「2026 年到底谁在真正被调用」,OpenRouter Rankings按周 Token 吞吐量给出了比任何 Benchmark 更诚实的答案:截至 2026 年 5 月 24 日那一周,全球周调用量达 28.9 万亿 Token(连续五周上涨),中国模型以 9.223T 连续四周超越美国,DeepSeek 三款模型合计 5.74T 称霸厂商榜首。本文面向做模型路由与成本控制的开发者与技术负责人,交付数据来源说明当周 Top 10 解读Token 份额 vs 美元收入的双重真相a16z 基准测试反转发现六步周榜追踪 Runbook,并说明长期跑 Agent 时 Mac Mini M4 月租 为何仍是稳定宿主。

01

为什么账单数据比 Benchmark 排行榜更可信?五大认知陷阱

OpenRouter 是全球最大的中立 AI 模型 API 聚合平台,接入 300+ 模型、覆盖 60+ 供应商,超 800 万 用户、每月约 100 万亿 Token 流量。其公开排行榜(openrouter.ai/rankings)按7 天滚动 Token 吞吐量统计,输入与输出均计入——这是开发者「用钱投票」后的真实体温计,而非厂商 PPT 上的雷达图。

一年前 OpenRouter 周处理量约 2.4 万亿,如今单周已达 28.9 万亿,增长约 12 倍。Token 调用量已从技术指标升级为商业战场晴雨表:投资者用它评估 AI 商业化进度,开发者用它选择「不押宝单一厂商」的路由策略。

  1. 01

    Benchmark 可被「刷分」优化:MMLU、HumanEval 高分不代表 Agent 工作流中 XML/JSON 工具调用稳定,更不代表 30 分钟自主编码不迷路。

  2. 02

    调用量反映落地意愿:开发者愿为某模型持续付费并烧算力,说明其在稳定性、响应速度、性价比上通过了生产检验。

  3. 03

    周维度捕捉趋势:按周统计比月度快照更灵敏,DeepSeek V4-Flash 当周环比 +66% 这类信号在月榜里会被平滑掉。

  4. 04

    免费模型扭曲感知:Owl Alpha 等零单价模型会放大实验流量,阅读周榜须同时看Token 份额美元收入份额

  5. 05

    编程已成最大单一用途:OpenRouter + a16z 联合报告(覆盖 100 万亿 Token 匿名元数据)显示,编程任务占比从 2025 年初 11% 飙升至超 50%——榜单前列模型几乎都在为 Agent 与编码优化。

不是谁最聪明,而是谁最被调用,才推动 AI 真正落地——账单上的数字,比任何评测榜单都诚实。

02

2026 年 5 月 18–24 日:28.9T 全球周调用量与中美格局

下表汇总 OpenRouter 公开数据(统计周期:按周 7 天滚动,截止 2026 年 5 月 24 日)。数据交叉参照每日经济新闻(2026-05-25)、OpenRouter 官方榜单与 MACCOME 同期解读。

指标数据环比变化
全球周调用量28.9 万亿 Token+7.4%(连续五周上涨)
中国模型周调用量9.223 万亿 Token+19.89%
美国模型周调用量4.93 万亿 Token+16.27%
中美排名中国连续四周超越美国稳居全球首位

中国模型崛起时间线

时间节点中国模型流量占比
2025 年初< 2%
2026 年 2 月首次超越美国
2026 年 5 月~45%+,连续四周超美

口径说明:OpenRouter 按模型归属厂商统计地域份额;DeepSeek、腾讯、MiniMax、StepFun 等中国团队模型计入中国侧,Anthropic、Google、xAI 等计入美国侧。

03

当周模型调用量 Top 10:DeepSeek 矩阵三席入榜

以下为 2026 年 5 月 18–24 日按周 Token 量排序的前十模型。DeepSeek 旗下 V4-Flash、V4-Pro、V3.2 同时进入前九,系列合计 5.74T(环比 +25.9%),连续两周超越 Anthropic 与 Google 位居厂商第一。前周排名第 6 的 Kimi K2.6 当周跌出前十。

排名模型厂商周 Token 量环比特点
1DeepSeek-V4-FlashDeepSeek3.43T+66%Agent 工作流首选,极低价格
2腾讯 Hy3 PreviewTencent3.07T+16%限免结束后仍高增长
3Claude Sonnet 4.6Anthropic1.35T百万上下文,企业编程主力
4DeepSeek-V3.2DeepSeek1.31T低价长尾,角色扮演活跃
5Owl AlphaOpenRouter1.15T+29%免费 Agent 特化,百万上下文
6Gemini 3 Flash PreviewGoogle1.06T多模态,学术/医疗场景
7DeepSeek-V4-ProDeepSeek1.00T矩阵旗舰(系列合计 5.74T)
8MiniMax M2.7MiniMax806B长上下文性价比之选
9Grok 4.1 FastxAI721B2M 上下文,法律场景强势
10Step 3.5 FlashStepFun673B快速低价,批处理场景
04

厂商格局:Token 份额 vs 美元收入的「双重真相」

只看 Token 调用量会遗漏定价差异带来的商业现实。Anthropic 呈现典型的溢价悖论:Token 份额约 12%(一年前为 25%,持续下滑),美元收入份额却约 46%——企业级用户仍为 Claude 付高价,但流量主导权已拱手相让。Claude Opus 4.6 月收入约 $2500 万,Token 量却只有 DeepSeek 的零头。

市场分层代表模型Token 特征收入特征
高价值·低流量Claude Opus 系列份额下滑企业复杂推理,付费能力强
性价比·中流量Google Gemini Flash稳定增长多模态、学术场景
极低价·高流量DeepSeek / MiniMax / StepFun份额快速扩张Agent、编程、批处理主导

OpenRouter + a16z《2025 AI 使用报告》还揭示了一个反常识发现:模型的基准测试分数与其实际市场份额几乎呈反比。开发者更关注推理成本而非极限能力;Agent 工作流更依赖稳定性与 API 响应速度。这与周榜上 DeepSeek、Hy3 霸榜而部分 Benchmark 冠军缺席前十的现象完全吻合。

05

六步 Runbook:按周追踪 OpenRouter 排行并调整模型路由

周榜每周更新,路由策略也应按周迭代。以下 Runbook 适用于 Claude Code、Cursor、OpenClaw 或自研 Gateway,目标是把「榜单洞察」变成可执行的配置变更。

  1. 01

    固定每周一打开 Rankings:访问 openrouter.ai/rankings,记录全球总量、中美份额与 Top 10 变动,存档截图供团队复盘。

  2. 02

    区分 Token 与美元维度:同时查看 Token 份额与 Revenue 份额,避免把免费模型(Owl Alpha)的高流量误判为「生产首选」。

  3. 03

    按任务场景映射模型:Agent / 批量 → DeepSeek-V4-Flash;企业复杂推理 → Claude Opus;多模态 → Gemini Flash;关注新进榜单模型(Hy3、Owl Alpha)作为下一爆款信号。

  4. 04

    用固定 Prompt 集回归:每周对同一 Issue 子集跑编码任务,记录工具调用失败率,对比周榜变化是否影响你的实际体验。

  5. 05

    更新路由 JSON 与预算熔断:Flash 档放宽并发,Opus 档设月度硬顶;主路由失败时走降级链(Sonnet → V4-Flash → 人工队列)。

  6. 06

    绑定 7×24 宿主验证路由:路由层可在任意云;若 Agent 依赖 macOS(Claude Code、OpenClaw),将守护进程部署到月租 Mac Mini,避免笔记本合盖中断长跑任务。

json · 按周榜调整的多模型路由(概念配置)
{
  "weekly_review": "2026-05-24",
  "routes": {
    "agent_batch": "openrouter/deepseek/deepseek-v4-flash",
    "enterprise": "openrouter/anthropic/claude-sonnet-4.6",
    "complex_reasoning": "openrouter/anthropic/claude-opus-4.6",
    "multimodal": "openrouter/google/gemini-3-flash-preview",
    "experiment": "openrouter/owl-alpha"
  },
  "fallback": ["enterprise", "agent_batch"],
  "monthly_cap_usd": 800
}
06

可引用硬核数据与 Agent 宿主选择

撰写内部 memo 或架构评审时,可直接引用以下经 OpenRouter 公开数据与媒体报道交叉验证的数据点(统计周期:2026 年 5 月 18–24 日):

  • 全球周调用量:28.9T Token,环比 +7.4%,连续五周上涨;一年前约 2.4T,增长约 12 倍/年
  • DeepSeek 矩阵:V4-Flash 3.43T + V4-Pro 1.00T + V3.2 1.31T = 系列合计 5.74T,厂商排名第一。
  • 编程任务占比:OpenRouter + a16z 报告:从 2025 年初 11% 升至超 50%,为最大单一用途类别。
  • Anthropic 溢价:Token 份额 ~12% vs 美元收入份额 ~46%;Opus 4.6 月收入约 $2500 万
  • 中国模型份额:2025 年初 <2% → 2026 年 5 月 ~45%+,连续四周超美。

OpenRouter 解决的是推理供应商切换,却无法替代进程守护、密钥边界与 Apple 工具链。许多团队在 Flash 档把 API 成本压到极低,却仍在笔记本合盖时丢失半夜的 Agent 运行;或把 OpenClaw 塞进 Linux VPS 后反复遇到 Metal / Keychain / Xcode 缺失。与OpenRouter 趋势选型指南租赁 Mac Mini 跑 OpenClaw同理:模型可按 Token 计价随时换,宿主 uptime 却是 OpEx 合同。对要把多模型路由当基础设施、同时跑 iOS CI/CD 与跨夜 Agent 的团队,VpsMesh Mac Mini M4 云端租赁通常是比个人笔记本更稳的生产选择。套餐见 Mac Mini M4 租赁价格,部署见 帮助中心

常见问题

读者最常问的三个问题

Token 调用量反映开发者真实付费与生产流量,是「用钱投票」的市场温度计;Benchmark 适合比较极限能力,但 OpenRouter + a16z 报告显示二者常呈反比。重大选型应结合周榜趋势与固定任务集私有回归,并每月访问 openrouter.ai/rankings 复核。

DeepSeek V4-Flash 单价极低(约 $0.10/$0.40 per M tokens),Agent 与批处理可大规模调用,当周 3.43T 居首;Claude 单价高 30–50 倍,Token 份额低但美元收入份额仍约 46%。按场景选型而非盲目追最强,详见 趋势选型指南

不必须。纯 OpenRouter API 可在 Linux 调用。若栈含 Claude Code、Xcode 或 OpenClaw 守护,Mac Mini M4 月租更省心。建议先租 1 个月验证周榜路由与守护配置,套餐见 Mac Mini M4 租赁价格,下单见 订购页