28,9T за неделю · Китай vs США · матрица DeepSeek · token vs dollar · tracking runbook ×6
Между MMLU-лидербордами и prod-реальностью один вопрос: кого реально вызывают в 2026? OpenRouter Rankings и недельный token throughput честнее любого benchmark: неделя до 24 мая 2026 — 28,9 триллиона токенов глобально (пятая неделя роста подряд), китайские модели 9,223T четвёртую неделю обгоняют США, матрица DeepSeek — 5,74T на вершине vendor chart. Статья для dev и tech lead с model routing и cost control: источники данных, Top 10 недели, token share vs dollar revenue, инверсия a16z/benchmarks, 6-step weekly tracking runbook и почему Mac Mini M4 в месяц — стабильный хост для 24/7 agent pipeline.
OpenRouter — крупнейший нейтральный API-агрегатор: 300+ моделей, 60+ вендоров, 8M+ юзеров, ~100T tokens в месяц. Публичный ranking (openrouter.ai/rankings) считает 7-day rolling token throughput — input и output вместе. Это термометр «голосования деньгами», не radar chart из vendor deck.
Год назад OpenRouter крутил ~2,4T tokens в неделю; одна неделя 2026 — 28,9T, рост ×12. Token volume из tech KPI превратился в strategic signal: инвесторы смотрят monetization AI, dev teams — multi-vendor routing без single bet.
Benchmarks оптимизируются под score: Высокий MMLU/HumanEval не гарантирует стабильный XML/JSON tool calling и 30 минут автономного coding без lost agent.
Volume = deploy intent: Кто платит и жжёт compute постоянно — модель прошла prod-check по stability, latency, price/perf.
Weekly granularity ловит тренды: DeepSeek V4-Flash +66% за неделю — в monthly chart это сгладится.
Free tier искажает картину: Owl Alpha с нулевым прайсом раздувает experimental traffic; читайте token share и revenue share в паре.
Coding — largest single use case: OpenRouter + a16z (100T tokens metadata): coding с 11% начала 2025 до 50%+ — top models заточены под agent и code.
Не кто умнее на слайде, а кто чаще вызывается — billing numbers честнее любого eval leaderboard.
Сводка публичных данных OpenRouter (период: 7-day rolling, cutoff 24 мая 2026). Cross-check с медиа (25 мая 2026), официальным chart и сторонними разборами.
| Метрика | Значение | WoW |
|---|---|---|
| Global weekly volume | 28,9T tokens | +7,4% (5-я неделя роста) |
| China models | 9,223T | +19,89% |
| USA models | 4,93T | +16,27% |
| China vs USA | Китай 4 недели подряд впереди | #1 globally |
| Дата | China traffic share |
|---|---|
| Начало 2025 | < 2% |
| Февраль 2026 | Впервые обгон USA |
| Май 2026 | ~45%+, 4 недели впереди USA |
Methodology: OpenRouter группирует по vendor origin; DeepSeek, Tencent, MiniMax, StepFun — China side; Anthropic, Google, xAI — USA side.
Ranking 18–24 мая 2026 по weekly token volume. V4-Flash, V4-Pro, V3.2 DeepSeek в top nine; серия 5,74T (+25,9% WoW), vendor #1 вторую неделю подряд над Anthropic и Google. Kimi K2.6 (rank #6 прошлой недели) выпал из top 10.
| # | Model | Vendor | Weekly tokens | WoW | Profile |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3,43T | +66% | Agent workhorse, ultra-cheap |
| 2 | Tencent Hy3 Preview | Tencent | 3,07T | +16% | Post-free-tier growth |
| 3 | Claude Sonnet 4.6 | Anthropic | 1,35T | — | 1M context, enterprise code |
| 4 | DeepSeek-V3.2 | DeepSeek | 1,31T | — | Cheap long-tail, RP active |
| 5 | Owl Alpha | OpenRouter | 1,15T | +29% | Free, agent-tuned, 1M ctx |
| 6 | Gemini 3 Flash Preview | 1,06T | — | Multimodal, academia/med | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1,00T | — | Matrix flagship (series 5,74T) |
| 8 | MiniMax M2.7 | MiniMax | 806B | — | Long context value |
| 9 | Grok 4.1 Fast | xAI | 721B | — | 2M ctx, legal strong |
| 10 | Step 3.5 Flash | StepFun | 673B | — | Fast cheap batch |
Смотреть только tokens — miss pricing gap. Anthropic — классический premium paradox: token share ~12% (год назад 25%, падает), dollar revenue ~46%. Enterprise платит premium за Claude, но traffic dominance уехала. Claude Opus 4.6 — ~$25M monthly revenue при token volume на порядки ниже DeepSeek.
| Segment | Example | Token profile | Revenue profile |
|---|---|---|---|
| High-value · low traffic | Claude Opus series | Share declining | Complex reasoning, strong ARPU |
| Mid traffic · value | Google Gemini Flash | Steady growth | Multimodal, research |
| Ultra-cheap · high traffic | DeepSeek / MiniMax / StepFun | Rapid expansion | Agent, code, batch dominate |
OpenRouter + a16z «2025 AI Usage»: benchmark score и market share часто обратно коррелируют. Devs оптимизируют inference cost, не peak capability; agent pipelines завязаны на API stability и latency. Отсюда DeepSeek/Hy3 на вершине при benchmark champions вне top 10.
Chart обновляется каждую неделю — routing policy должна идти в ногу. Runbook для Claude Code, Cursor, OpenClaw или custom gateway: превращаем chart insight в config diff.
Каждый понедельник — Rankings: openrouter.ai/rankings — global total, China/USA share, top 10 delta; screenshot в team retro archive.
Разделить token и dollar: Revenue share рядом с token share; free model (Owl Alpha) ≠ prod default.
Scenario mapping: Agent/batch → DeepSeek-V4-Flash; enterprise reasoning → Claude Opus; multimodal → Gemini Flash; new entrants (Hy3, Owl Alpha) — early signal.
Fixed prompt suite regression: Еженедельно тот же issue subset, tool-call fail rate, сверка с weekly chart.
Routing JSON + budget circuit breaker: Flash tier — больше concurrency; Opus — hard monthly cap; fallback Sonnet → V4-Flash → human queue.
7×24 host для routing validation: Routing layer — anywhere; macOS stack (Claude Code, OpenClaw) — daemons на Mac Mini monthly rent, без laptop sleep на night runs.
{
"weekly_review": "2026-05-24",
"routes": {
"agent_batch": "openrouter/deepseek/deepseek-v4-flash",
"enterprise": "openrouter/anthropic/claude-sonnet-4.6",
"complex_reasoning": "openrouter/anthropic/claude-opus-4.6",
"multimodal": "openrouter/google/gemini-3-flash-preview",
"experiment": "openrouter/owl-alpha"
},
"fallback": ["enterprise", "agent_batch"],
"monthly_cap_usd": 800
}
Для internal memo / architecture review — OpenRouter public data + media cross-check, period 18–24 May 2026:
OpenRouter решает inference vendor switch, но не process supervision, key boundary, Apple toolchain. Команды давят Flash cost до минимума и теряют night agent runs при закрытии lid — или упираются в Metal/Keychain на Linux VPS. Как в OpenRouter trends guide и аренде Mac Mini под OpenClaw: models reprice per token; host uptime — OpEx contract. Для multi-model routing + iOS CI + overnight agents VpsMesh Mac Mini M4 cloud rent обычно стабильнее personal machine. Тарифы: цены аренды Mac Mini M4, deploy: центр помощи.
Weekly token volume = реальные платежи и prod traffic, market thermometer через money vote. Benchmarks — peak capability; OpenRouter + a16z часто показывают inverse correlation. Major model pick: weekly trends + private regression; monthly check openrouter.ai/rankings.
DeepSeek V4-Flash ~$0.10/$0.40 per M tokens — agent/batch scale hard, 3,43T за неделю; Claude 30–50× дороже, low token share, ~46% dollar revenue. Scenario-first, не «strongest model» chase — см. trends guide.
Не обязательно. Pure OpenRouter API — на Linux. Claude Code, Xcode или OpenClaw daemons — Mac Mini M4 monthly rent стабильнее. Месяц на weekly routing test — цены аренды, заказ оформить заказ, setup центр помощи.