28.9T 周调用量 · 中美格局逆转 · DeepSeek 矩阵称霸 · Token vs 美元双重真相 · 六步周榜追踪
若你在 MMLU 榜单与生产体验之间反复横跳,却想知道「2026 年到底谁在真正被调用」,OpenRouter Rankings 的按周 Token 吞吐量给出了比任何 Benchmark 更诚实的答案:截至 2026 年 5 月 24 日那一周,全球周调用量达 28.9 万亿 Token(连续五周上涨),中国模型以 9.223T 连续四周超越美国,DeepSeek 三款模型合计 5.74T 称霸厂商榜首。本文面向做模型路由与成本控制的开发者与技术负责人,交付数据来源说明、当周 Top 10 解读、Token 份额 vs 美元收入的双重真相、a16z 基准测试反转发现与六步周榜追踪 Runbook,并说明长期跑 Agent 时 Mac Mini M4 月租 为何仍是稳定宿主。
OpenRouter 是全球最大的中立 AI 模型 API 聚合平台,接入 300+ 模型、覆盖 60+ 供应商,超 800 万 用户、每月约 100 万亿 Token 流量。其公开排行榜(openrouter.ai/rankings)按7 天滚动 Token 吞吐量统计,输入与输出均计入——这是开发者「用钱投票」后的真实体温计,而非厂商 PPT 上的雷达图。
一年前 OpenRouter 周处理量约 2.4 万亿,如今单周已达 28.9 万亿,增长约 12 倍。Token 调用量已从技术指标升级为商业战场晴雨表:投资者用它评估 AI 商业化进度,开发者用它选择「不押宝单一厂商」的路由策略。
Benchmark 可被「刷分」优化:MMLU、HumanEval 高分不代表 Agent 工作流中 XML/JSON 工具调用稳定,更不代表 30 分钟自主编码不迷路。
调用量反映落地意愿:开发者愿为某模型持续付费并烧算力,说明其在稳定性、响应速度、性价比上通过了生产检验。
周维度捕捉趋势:按周统计比月度快照更灵敏,DeepSeek V4-Flash 当周环比 +66% 这类信号在月榜里会被平滑掉。
免费模型扭曲感知:Owl Alpha 等零单价模型会放大实验流量,阅读周榜须同时看Token 份额与美元收入份额。
编程已成最大单一用途:OpenRouter + a16z 联合报告(覆盖 100 万亿 Token 匿名元数据)显示,编程任务占比从 2025 年初 11% 飙升至超 50%——榜单前列模型几乎都在为 Agent 与编码优化。
不是谁最聪明,而是谁最被调用,才推动 AI 真正落地——账单上的数字,比任何评测榜单都诚实。
下表汇总 OpenRouter 公开数据(统计周期:按周 7 天滚动,截止 2026 年 5 月 24 日)。数据交叉参照每日经济新闻(2026-05-25)、OpenRouter 官方榜单与 MACCOME 同期解读。
| 指标 | 数据 | 环比变化 |
|---|---|---|
| 全球周调用量 | 28.9 万亿 Token | +7.4%(连续五周上涨) |
| 中国模型周调用量 | 9.223 万亿 Token | +19.89% |
| 美国模型周调用量 | 4.93 万亿 Token | +16.27% |
| 中美排名 | 中国连续四周超越美国 | 稳居全球首位 |
| 时间节点 | 中国模型流量占比 |
|---|---|
| 2025 年初 | < 2% |
| 2026 年 2 月 | 首次超越美国 |
| 2026 年 5 月 | ~45%+,连续四周超美 |
口径说明:OpenRouter 按模型归属厂商统计地域份额;DeepSeek、腾讯、MiniMax、StepFun 等中国团队模型计入中国侧,Anthropic、Google、xAI 等计入美国侧。
以下为 2026 年 5 月 18–24 日按周 Token 量排序的前十模型。DeepSeek 旗下 V4-Flash、V4-Pro、V3.2 同时进入前九,系列合计 5.74T(环比 +25.9%),连续两周超越 Anthropic 与 Google 位居厂商第一。前周排名第 6 的 Kimi K2.6 当周跌出前十。
| 排名 | 模型 | 厂商 | 周 Token 量 | 环比 | 特点 |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3.43T | +66% | Agent 工作流首选,极低价格 |
| 2 | 腾讯 Hy3 Preview | Tencent | 3.07T | +16% | 限免结束后仍高增长 |
| 3 | Claude Sonnet 4.6 | Anthropic | 1.35T | — | 百万上下文,企业编程主力 |
| 4 | DeepSeek-V3.2 | DeepSeek | 1.31T | — | 低价长尾,角色扮演活跃 |
| 5 | Owl Alpha | OpenRouter | 1.15T | +29% | 免费 Agent 特化,百万上下文 |
| 6 | Gemini 3 Flash Preview | 1.06T | — | 多模态,学术/医疗场景 | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1.00T | — | 矩阵旗舰(系列合计 5.74T) |
| 8 | MiniMax M2.7 | MiniMax | 806B | — | 长上下文性价比之选 |
| 9 | Grok 4.1 Fast | xAI | 721B | — | 2M 上下文,法律场景强势 |
| 10 | Step 3.5 Flash | StepFun | 673B | — | 快速低价,批处理场景 |
只看 Token 调用量会遗漏定价差异带来的商业现实。Anthropic 呈现典型的溢价悖论:Token 份额约 12%(一年前为 25%,持续下滑),美元收入份额却约 46%——企业级用户仍为 Claude 付高价,但流量主导权已拱手相让。Claude Opus 4.6 月收入约 $2500 万,Token 量却只有 DeepSeek 的零头。
| 市场分层 | 代表模型 | Token 特征 | 收入特征 |
|---|---|---|---|
| 高价值·低流量 | Claude Opus 系列 | 份额下滑 | 企业复杂推理,付费能力强 |
| 性价比·中流量 | Google Gemini Flash | 稳定增长 | 多模态、学术场景 |
| 极低价·高流量 | DeepSeek / MiniMax / StepFun | 份额快速扩张 | Agent、编程、批处理主导 |
OpenRouter + a16z《2025 AI 使用报告》还揭示了一个反常识发现:模型的基准测试分数与其实际市场份额几乎呈反比。开发者更关注推理成本而非极限能力;Agent 工作流更依赖稳定性与 API 响应速度。这与周榜上 DeepSeek、Hy3 霸榜而部分 Benchmark 冠军缺席前十的现象完全吻合。
周榜每周更新,路由策略也应按周迭代。以下 Runbook 适用于 Claude Code、Cursor、OpenClaw 或自研 Gateway,目标是把「榜单洞察」变成可执行的配置变更。
固定每周一打开 Rankings:访问 openrouter.ai/rankings,记录全球总量、中美份额与 Top 10 变动,存档截图供团队复盘。
区分 Token 与美元维度:同时查看 Token 份额与 Revenue 份额,避免把免费模型(Owl Alpha)的高流量误判为「生产首选」。
按任务场景映射模型:Agent / 批量 → DeepSeek-V4-Flash;企业复杂推理 → Claude Opus;多模态 → Gemini Flash;关注新进榜单模型(Hy3、Owl Alpha)作为下一爆款信号。
用固定 Prompt 集回归:每周对同一 Issue 子集跑编码任务,记录工具调用失败率,对比周榜变化是否影响你的实际体验。
更新路由 JSON 与预算熔断:Flash 档放宽并发,Opus 档设月度硬顶;主路由失败时走降级链(Sonnet → V4-Flash → 人工队列)。
绑定 7×24 宿主验证路由:路由层可在任意云;若 Agent 依赖 macOS(Claude Code、OpenClaw),将守护进程部署到月租 Mac Mini,避免笔记本合盖中断长跑任务。
{
"weekly_review": "2026-05-24",
"routes": {
"agent_batch": "openrouter/deepseek/deepseek-v4-flash",
"enterprise": "openrouter/anthropic/claude-sonnet-4.6",
"complex_reasoning": "openrouter/anthropic/claude-opus-4.6",
"multimodal": "openrouter/google/gemini-3-flash-preview",
"experiment": "openrouter/owl-alpha"
},
"fallback": ["enterprise", "agent_batch"],
"monthly_cap_usd": 800
}
撰写内部 memo 或架构评审时,可直接引用以下经 OpenRouter 公开数据与媒体报道交叉验证的数据点(统计周期:2026 年 5 月 18–24 日):
OpenRouter 解决的是推理供应商切换,却无法替代进程守护、密钥边界与 Apple 工具链。许多团队在 Flash 档把 API 成本压到极低,却仍在笔记本合盖时丢失半夜的 Agent 运行;或把 OpenClaw 塞进 Linux VPS 后反复遇到 Metal / Keychain / Xcode 缺失。与OpenRouter 趋势选型指南、租赁 Mac Mini 跑 OpenClaw同理:模型可按 Token 计价随时换,宿主 uptime 却是 OpEx 合同。对要把多模型路由当基础设施、同时跑 iOS CI/CD 与跨夜 Agent 的团队,VpsMesh Mac Mini M4 云端租赁通常是比个人笔记本更稳的生产选择。套餐见 Mac Mini M4 租赁价格,部署见 帮助中心。
周 Token 调用量反映开发者真实付费与生产流量,是「用钱投票」的市场温度计;Benchmark 适合比较极限能力,但 OpenRouter + a16z 报告显示二者常呈反比。重大选型应结合周榜趋势与固定任务集私有回归,并每月访问 openrouter.ai/rankings 复核。
DeepSeek V4-Flash 单价极低(约 $0.10/$0.40 per M tokens),Agent 与批处理可大规模调用,当周 3.43T 居首;Claude 单价高 30–50 倍,Token 份额低但美元收入份额仍约 46%。按场景选型而非盲目追最强,详见 趋势选型指南。
不必须。纯 OpenRouter API 可在 Linux 调用。若栈含 Claude Code、Xcode 或 OpenClaw 守护,Mac Mini M4 月租更省心。建议先租 1 个月验证周榜路由与守护配置,套餐见 Mac Mini M4 租赁价格,下单见 订购页。