28.9T 週次トークン · 中米シフト · DeepSeek マトリクス首位 · トークン vs ドル · 6ステップ週次追跡
MMLU ランキングと本番体験の間で揺れながら「2026 年に本当に呼ばれているのは誰か」を知りたいなら、OpenRouter Rankings の週次トークンスループットは Benchmark より誠実です。2026 年 5 月 24 日週の世界週次呼び出し量は 28.9 兆トークン(5 週連続増)で、中国モデルは 9.223T となり 4 週連続で米国を上回りました。DeepSeek 3 モデル合計 5.74T がベンダー首位です。本記事はモデルルーティングとコスト管理を担う開発者・技術責任者向けに、データソース、当週 Top 10、トークンシェア vs ドル収益、a16z ベンチマーク逆転、6 ステップ週次追跡 Runbook、長期 Agent 運用における Mac Mini M4 月額レンタルの意義をお届けします。
OpenRouter は最大規模の中立 AI モデル API 集約基盤で、300+ モデル、60+ プロバイダ、800 万超 ユーザー、月間約 100 兆トークンを処理します。公開ランキング(openrouter.ai/rankings)は7 日ローリングのトークンスループットで集計し、入出力ともにカウントします。開発者が「お金で投票」した結果であり、ベンダーのレーダーチャートではありません。
1 年前の週次処理量は約 2.4 兆、現在は 28.9 兆と約 12 倍に成長しました。トークン呼び出し量は商用化の晴雨表となり、投資家は AI 収益化を、開発者は単一ベンダーに依存しないルーティングを判断材料にしています。
Benchmark は最適化され得る:MMLU や HumanEval の高得点は、Agent ワークフローでの XML/JSON ツール呼び出しの安定性や、30 分の自律コーディングを保証しません。
呼び出し量は本番採用の意思:開発者が継続課金し算力を消費するのは、安定性・応答速度・コスパが本番で証明されたからです。
週次でトレンドを捉える:DeepSeek V4-Flash の週次 +66% のような急伸は、月次集計では平滑化されます。
無料モデルが認知を歪める:Owl Alpha など零単価モデルは実験トラフィックを増幅します。トークンシェアとドル収益シェアの両方を見てください。
プログラミングが最大用途に:OpenRouter + a16z 報告(100 兆トークンの匿名メタデータ)では、コーディング占比が 2025 年初の 11% から 50% 超へ。Top 10 は Agent とコーディング向けに最適化されています。
最も賢いモデルではなく、最も呼ばれるモデルが AI の実装を前に進めます。請求データはどの評価ランキングよりも正直です。
下表は OpenRouter 公開データ(7 日ローリング週次、2026 年 5 月 24 日時点)の要約です。每日经济新闻(2026-05-25)、OpenRouter 公式、MACCOME 同期解説と突合しています。
| 指標 | 数値 | 前週比 |
|---|---|---|
| 世界週次呼び出し量 | 28.9 兆トークン | +7.4%(5 週連続増) |
| 中国モデル週次 | 9.223 兆トークン | +19.89% |
| 米国モデル週次 | 4.93 兆トークン | +16.27% |
| 中米順位 | 中国が 4 週連続で米国超え | 世界首位地域 |
| 時期 | 中国モデル流量占比 |
|---|---|
| 2025 年初 | < 2% |
| 2026 年 2 月 | 初めて米国を上回る |
| 2026 年 5 月 | ~45%+、4 週連続で米国超え |
集計口径:OpenRouter はモデルの所属ベンダーで地域シェアを集計します。DeepSeek、Tencent、MiniMax、StepFun は中国側、Anthropic、Google、xAI は米国側に分類されます。
2026 年 5 月 18–24 日の週次トークン順位です。DeepSeek の V4-Flash、V4-Pro、V3.2 がいずれも Top 9 入り、系列合計 5.74T(前週比 +25.9%)で 2 週連続 Anthropic・Google を上回りベンダー 1 位。前週 6 位の Kimi K2.6 は Top 10 圏外に。
| 順位 | モデル | ベンダー | 週次トークン | 前週比 | 特徴 |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3.43T | +66% | Agent 向け、超低価格 |
| 2 | Tencent Hy3 Preview | Tencent | 3.07T | +16% | 無料終了後も高成長 |
| 3 | Claude Sonnet 4.6 | Anthropic | 1.35T | — | 100 万コンテキスト、企業コーディング |
| 4 | DeepSeek-V3.2 | DeepSeek | 1.31T | — | 低価格ロングテール |
| 5 | Owl Alpha | OpenRouter | 1.15T | +29% | 無料 Agent 特化、100 万コンテキスト |
| 6 | Gemini 3 Flash Preview | 1.06T | — | マルチモーダル、学術/医療 | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1.00T | — | マトリクス旗艦(系列 5.74T) |
| 8 | MiniMax M2.7 | MiniMax | 806B | — | 長コンテキストのコスパ |
| 9 | Grok 4.1 Fast | xAI | 721B | — | 200 万コンテキスト、法務 |
| 10 | Step 3.5 Flash | StepFun | 673B | — | 高速低価格、バッチ |
トークン量だけでは価格差による商業現実を見逃します。Anthropic は典型的なプレミアム逆説:トークンシェア約 12%(1 年前 25%、継続低下)に対し、ドル収益シェアは約 46%。エンタープライズは Claude に高単価を払い続けますが、流量の主導権は他社へ。Claude Opus 4.6 の月収は約 2500 万ドルで、トークン量は DeepSeek のごく一部です。
| セグメント | 代表モデル | トークン傾向 | 収益傾向 |
|---|---|---|---|
| 高単価・低流量 | Claude Opus 系列 | シェア低下 | 複雑推論、高 ARPU |
| 中価格・中流量 | Google Gemini Flash | 安定成長 | マルチモーダル、学術 |
| 超低価格・高流量 | DeepSeek / MiniMax / StepFun | シェア急拡大 | Agent、コーディング、バッチ |
OpenRouter + a16z《2025 AI 利用報告》は、ベンチマークスコアと市場シェアがしばしば逆相関することを示しています。開発者は限界能力より推論コストと API 安定性を重視し、Agent は応答速度に依存します。DeepSeek と Hy3 が週次ランキング首位なのに、ベンチマーク王者が Top 10 外にいる現象と一致します。
週次ランキングは毎週更新されます。ルーティングも週次で見直すべきです。Claude Code、Cursor、OpenClaw、自前 Gateway 向けに、ランキング洞察を設定変更へ落とし込む手順です。
毎週月曜に Rankings を開く:openrouter.ai/rankings で世界合計、中米シェア、Top 10 変動を記録し、スクリーンショットをチーム共有用に保存します。
トークンとドルを分けて見る:Token シェアと Revenue シェアを併読し、無料モデル(Owl Alpha)の高流量を本番デフォルトと誤認しないようにします。
タスク別にモデルを割当:Agent/バッチ → DeepSeek-V4-Flash;企業複雑推論 → Claude Opus;マルチモーダル → Gemini Flash;新規(Hy3、Owl Alpha)は次のブレイクアウト信号として監視。
固定 Prompt セットで回帰:毎週同じ Issue サブセットでコーディングを実行し、ツール呼び出し失敗率を週次ランキングの変化と照合します。
ルーティング JSON と予算上限を更新:Flash tier は並列を緩和、Opus tier は月次ハードキャップ;フォールバック Sonnet → V4-Flash → 人手キュー。
7×24 ホストでルートを検証:ルーティング層は任意のクラウドで可;macOS 依存(Claude Code、OpenClaw)の Agent は月額 Mac Mini レンタルにデーモンを置き、ノート PC のスリープによる中断を避けます。
{
"weekly_review": "2026-05-24",
"routes": {
"agent_batch": "openrouter/deepseek/deepseek-v4-flash",
"enterprise": "openrouter/anthropic/claude-sonnet-4.6",
"complex_reasoning": "openrouter/anthropic/claude-opus-4.6",
"multimodal": "openrouter/google/gemini-3-flash-preview",
"experiment": "openrouter/owl-alpha"
},
"fallback": ["enterprise", "agent_batch"],
"monthly_cap_usd": 800
}
社内 memo やアーキテクチャレビュー向けに、OpenRouter 公開データと同期メディア報道で突合した数値(2026 年 5 月 18–24 日週)です:
OpenRouter は推論ベンダー切替を解きますが、プロセス監視、鍵境界、Apple ツールチェーンは代替できません。Flash tier で API コストを下げても、ノート PC スリープで夜間 Agent が止まったり、Linux VPS で Metal/Keychain/Xcode が欠ける OpenClaw 運用に苦しむチームも多いです。OpenRouter トレンド選定ガイドやMac Mini レンタルで OpenClaw を運用と同様、モデルはトークン課金でいつでも替えられるが、ホスト uptime は OpEx 契約です。多モデルルーティングをインフラ化し iOS CI/CD と夜間 Agent を回すチームには、VpsMesh Mac Mini M4 クラウドレンタルが個人 MacBook より安定しやすいです。料金は Mac Mini M4 レンタル料金、構築は ヘルプセンターをご覧ください。
週次トークン呼び出し量は開発者の実課金と本番トラフィックを反映する市場温度計です。Benchmark は限界能力の比較向きで、OpenRouter + a16z 報告ではシェアと逆相関しがちです。週次ランキングのトレンドと固定タスクのプライベート回帰を組み合わせ、openrouter.ai/rankings を月次で確認してください。
DeepSeek V4-Flash は約 $0.10/$0.40 per M tokens と極めて安く、Agent とバッチで大規模呼び出しに適します(当週 3.43T 首位)。Claude は 30–50 倍の単価でトークンシェアは低い一方、ドル収益シェアは約 46% です。詳しくは OpenRouter トレンド選定ガイド をご参照ください。
必須ではありません。純粋な OpenRouter API は Linux でも利用できます。Claude Code、Xcode、OpenClaw デーモンを含む場合は Mac Mini M4 月額レンタルが安心です。1 か月借りて週次ルートとデーモンを検証し、Mac Mini M4 レンタル料金、注文ページから始めてください。