OpenRouter: недельный рейтинг токенов 2026 — платёжные данные не врут

28,9T за неделю · Китай vs США · матрица DeepSeek · token vs dollar · tracking runbook ×6

OpenRouter weekly token rankings и billing data

Между MMLU-лидербордами и prod-реальностью один вопрос: кого реально вызывают в 2026? OpenRouter Rankings и недельный token throughput честнее любого benchmark: неделя до 24 мая 2026 — 28,9 триллиона токенов глобально (пятая неделя роста подряд), китайские модели 9,223T четвёртую неделю обгоняют США, матрица DeepSeek5,74T на вершине vendor chart. Статья для dev и tech lead с model routing и cost control: источники данных, Top 10 недели, token share vs dollar revenue, инверсия a16z/benchmarks, 6-step weekly tracking runbook и почему Mac Mini M4 в месяц — стабильный хост для 24/7 agent pipeline.

01

Почему billing data бьёт benchmark charts: пять cognitive traps

OpenRouter — крупнейший нейтральный API-агрегатор: 300+ моделей, 60+ вендоров, 8M+ юзеров, ~100T tokens в месяц. Публичный ranking (openrouter.ai/rankings) считает 7-day rolling token throughput — input и output вместе. Это термометр «голосования деньгами», не radar chart из vendor deck.

Год назад OpenRouter крутил ~2,4T tokens в неделю; одна неделя 2026 — 28,9T, рост ×12. Token volume из tech KPI превратился в strategic signal: инвесторы смотрят monetization AI, dev teams — multi-vendor routing без single bet.

  1. 01

    Benchmarks оптимизируются под score: Высокий MMLU/HumanEval не гарантирует стабильный XML/JSON tool calling и 30 минут автономного coding без lost agent.

  2. 02

    Volume = deploy intent: Кто платит и жжёт compute постоянно — модель прошла prod-check по stability, latency, price/perf.

  3. 03

    Weekly granularity ловит тренды: DeepSeek V4-Flash +66% за неделю — в monthly chart это сгладится.

  4. 04

    Free tier искажает картину: Owl Alpha с нулевым прайсом раздувает experimental traffic; читайте token share и revenue share в паре.

  5. 05

    Coding — largest single use case: OpenRouter + a16z (100T tokens metadata): coding с 11% начала 2025 до 50%+ — top models заточены под agent и code.

Не кто умнее на слайде, а кто чаще вызывается — billing numbers честнее любого eval leaderboard.

02

18–24 мая 2026: 28,9T global weekly и Китай vs США

Сводка публичных данных OpenRouter (период: 7-day rolling, cutoff 24 мая 2026). Cross-check с медиа (25 мая 2026), официальным chart и сторонними разборами.

МетрикаЗначениеWoW
Global weekly volume28,9T tokens+7,4% (5-я неделя роста)
China models9,223T+19,89%
USA models4,93T+16,27%
China vs USAКитай 4 недели подряд впереди#1 globally

Timeline китайских моделей

ДатаChina traffic share
Начало 2025< 2%
Февраль 2026Впервые обгон USA
Май 2026~45%+, 4 недели впереди USA

Methodology: OpenRouter группирует по vendor origin; DeepSeek, Tencent, MiniMax, StepFun — China side; Anthropic, Google, xAI — USA side.

03

Top 10 недели: DeepSeek matrix занимает три слота

Ranking 18–24 мая 2026 по weekly token volume. V4-Flash, V4-Pro, V3.2 DeepSeek в top nine; серия 5,74T (+25,9% WoW), vendor #1 вторую неделю подряд над Anthropic и Google. Kimi K2.6 (rank #6 прошлой недели) выпал из top 10.

#ModelVendorWeekly tokensWoWProfile
1DeepSeek-V4-FlashDeepSeek3,43T+66%Agent workhorse, ultra-cheap
2Tencent Hy3 PreviewTencent3,07T+16%Post-free-tier growth
3Claude Sonnet 4.6Anthropic1,35T1M context, enterprise code
4DeepSeek-V3.2DeepSeek1,31TCheap long-tail, RP active
5Owl AlphaOpenRouter1,15T+29%Free, agent-tuned, 1M ctx
6Gemini 3 Flash PreviewGoogle1,06TMultimodal, academia/med
7DeepSeek-V4-ProDeepSeek1,00TMatrix flagship (series 5,74T)
8MiniMax M2.7MiniMax806BLong context value
9Grok 4.1 FastxAI721B2M ctx, legal strong
10Step 3.5 FlashStepFun673BFast cheap batch
04

Vendor landscape: token share vs dollar — double truth

Смотреть только tokens — miss pricing gap. Anthropic — классический premium paradox: token share ~12% (год назад 25%, падает), dollar revenue ~46%. Enterprise платит premium за Claude, но traffic dominance уехала. Claude Opus 4.6 — ~$25M monthly revenue при token volume на порядки ниже DeepSeek.

SegmentExampleToken profileRevenue profile
High-value · low trafficClaude Opus seriesShare decliningComplex reasoning, strong ARPU
Mid traffic · valueGoogle Gemini FlashSteady growthMultimodal, research
Ultra-cheap · high trafficDeepSeek / MiniMax / StepFunRapid expansionAgent, code, batch dominate

OpenRouter + a16z «2025 AI Usage»: benchmark score и market share часто обратно коррелируют. Devs оптимизируют inference cost, не peak capability; agent pipelines завязаны на API stability и latency. Отсюда DeepSeek/Hy3 на вершине при benchmark champions вне top 10.

05

6-step runbook: weekly OpenRouter tracking и routing updates

Chart обновляется каждую неделю — routing policy должна идти в ногу. Runbook для Claude Code, Cursor, OpenClaw или custom gateway: превращаем chart insight в config diff.

  1. 01

    Каждый понедельник — Rankings: openrouter.ai/rankings — global total, China/USA share, top 10 delta; screenshot в team retro archive.

  2. 02

    Разделить token и dollar: Revenue share рядом с token share; free model (Owl Alpha) ≠ prod default.

  3. 03

    Scenario mapping: Agent/batch → DeepSeek-V4-Flash; enterprise reasoning → Claude Opus; multimodal → Gemini Flash; new entrants (Hy3, Owl Alpha) — early signal.

  4. 04

    Fixed prompt suite regression: Еженедельно тот же issue subset, tool-call fail rate, сверка с weekly chart.

  5. 05

    Routing JSON + budget circuit breaker: Flash tier — больше concurrency; Opus — hard monthly cap; fallback Sonnet → V4-Flash → human queue.

  6. 06

    7×24 host для routing validation: Routing layer — anywhere; macOS stack (Claude Code, OpenClaw) — daemons на Mac Mini monthly rent, без laptop sleep на night runs.

json · weekly multi-model routing (concept)
{
  "weekly_review": "2026-05-24",
  "routes": {
    "agent_batch": "openrouter/deepseek/deepseek-v4-flash",
    "enterprise": "openrouter/anthropic/claude-sonnet-4.6",
    "complex_reasoning": "openrouter/anthropic/claude-opus-4.6",
    "multimodal": "openrouter/google/gemini-3-flash-preview",
    "experiment": "openrouter/owl-alpha"
  },
  "fallback": ["enterprise", "agent_batch"],
  "monthly_cap_usd": 800
}
06

Hard facts для memo и выбор agent host

Для internal memo / architecture review — OpenRouter public data + media cross-check, period 18–24 May 2026:

  • Global weekly: 28,9T tokens, +7,4% WoW, 5th growth week; year ago ~2,4T, ~12×/year.
  • DeepSeek matrix: V4-Flash 3,43T + V4-Pro 1,00T + V3.2 1,31T = 5,74T, vendor rank #1.
  • Coding share: OpenRouter + a16z: 11% (early 2025) → 50%+, largest category.
  • Anthropic premium: tokens ~12% vs dollars ~46%; Opus 4.6 ~$25M/month.
  • China share: early 2025 <2% → May 2026 ~45%+, 4 weeks ahead of USA.

OpenRouter решает inference vendor switch, но не process supervision, key boundary, Apple toolchain. Команды давят Flash cost до минимума и теряют night agent runs при закрытии lid — или упираются в Metal/Keychain на Linux VPS. Как в OpenRouter trends guide и аренде Mac Mini под OpenClaw: models reprice per token; host uptime — OpEx contract. Для multi-model routing + iOS CI + overnight agents VpsMesh Mac Mini M4 cloud rent обычно стабильнее personal machine. Тарифы: цены аренды Mac Mini M4, deploy: центр помощи.

FAQ

Частые вопросы

Weekly token volume = реальные платежи и prod traffic, market thermometer через money vote. Benchmarks — peak capability; OpenRouter + a16z часто показывают inverse correlation. Major model pick: weekly trends + private regression; monthly check openrouter.ai/rankings.

DeepSeek V4-Flash ~$0.10/$0.40 per M tokens — agent/batch scale hard, 3,43T за неделю; Claude 30–50× дороже, low token share, ~46% dollar revenue. Scenario-first, не «strongest model» chase — см. trends guide.

Не обязательно. Pure OpenRouter API — на Linux. Claude Code, Xcode или OpenClaw daemons — Mac Mini M4 monthly rent стабильнее. Месяц на weekly routing test — цены аренды, заказ оформить заказ, setup центр помощи.