OpenRouter weekly ranking или benchmark — что надёжнее?

Недельный token throughput отражает реальные платежи и prod-трафик — термометр рынка через деньги. Benchmarks сравнивают предельные способности, но часто обратно коррелируют с долей рынка. Крупный выбор модели: weekly trends + private regression на фиксированном task set.

Почему DeepSeek обгоняет Claude по недельному объёму?

DeepSeek V4-Flash ~$0.10/$0.40 за M tokens — agent и batch масштабируются; Claude в 30–50× дороже, token share низкий, dollar revenue share ~46%.

Нужен ли арендованный Mac Mini для agent 24/7?

Чистый OpenRouter API крутится на любом сервере. Если в стеке Claude Code, OpenClaw или Xcode — Mac Mini M4 в месяц стабильнее ноутбука в sleep. Месяц хватит проверить weekly routing и daemons.

OpenRouter: недельный рейтинг токенов 2026 — платёжные данные не врут

Почему billing data бьёт benchmark charts: пять cognitive traps

OpenRouter — крупнейший нейтральный API-агрегатор: 300+ моделей, 60+ вендоров, 8M+ юзеров, ~100T tokens в месяц. Публичный ranking (openrouter.ai/rankings) считает 7-day rolling token throughput — input и output вместе. Это термометр «голосования деньгами», не radar chart из vendor deck.

Год назад OpenRouter крутил ~2,4T tokens в неделю; одна неделя 2026 — 28,9T, рост ×12. Token volume из tech KPI превратился в strategic signal: инвесторы смотрят monetization AI, dev teams — multi-vendor routing без single bet.

01
Benchmarks оптимизируются под score: Высокий MMLU/HumanEval не гарантирует стабильный XML/JSON tool calling и 30 минут автономного coding без lost agent.
02
Volume = deploy intent: Кто платит и жжёт compute постоянно — модель прошла prod-check по stability, latency, price/perf.
03
Weekly granularity ловит тренды: DeepSeek V4-Flash +66% за неделю — в monthly chart это сгладится.
04
Free tier искажает картину: Owl Alpha с нулевым прайсом раздувает experimental traffic; читайте token share и revenue share в паре.
05
Coding — largest single use case: OpenRouter + a16z (100T tokens metadata): coding с 11% начала 2025 до 50%+ — top models заточены под agent и code.

Не кто умнее на слайде, а кто чаще вызывается — billing numbers честнее любого eval leaderboard.

18–24 мая 2026: 28,9T global weekly и Китай vs США

Сводка публичных данных OpenRouter (период: 7-day rolling, cutoff 24 мая 2026). Cross-check с медиа (25 мая 2026), официальным chart и сторонними разборами.

Метрика	Значение	WoW
Global weekly volume	28,9T tokens	+7,4% (5-я неделя роста)
China models	9,223T	+19,89%
USA models	4,93T	+16,27%
China vs USA	Китай 4 недели подряд впереди	#1 globally

Timeline китайских моделей

Дата	China traffic share
Начало 2025	< 2%
Февраль 2026	Впервые обгон USA
Май 2026	~45%+, 4 недели впереди USA

ℹ

Methodology: OpenRouter группирует по vendor origin; DeepSeek, Tencent, MiniMax, StepFun — China side; Anthropic, Google, xAI — USA side.

Top 10 недели: DeepSeek matrix занимает три слота

Ranking 18–24 мая 2026 по weekly token volume. V4-Flash, V4-Pro, V3.2 DeepSeek в top nine; серия 5,74T (+25,9% WoW), vendor #1 вторую неделю подряд над Anthropic и Google. Kimi K2.6 (rank #6 прошлой недели) выпал из top 10.

#	Model	Vendor	Weekly tokens	WoW	Profile
1	DeepSeek-V4-Flash	DeepSeek	3,43T	+66%	Agent workhorse, ultra-cheap
2	Tencent Hy3 Preview	Tencent	3,07T	+16%	Post-free-tier growth
3	Claude Sonnet 4.6	Anthropic	1,35T	—	1M context, enterprise code
4	DeepSeek-V3.2	DeepSeek	1,31T	—	Cheap long-tail, RP active
5	Owl Alpha	OpenRouter	1,15T	+29%	Free, agent-tuned, 1M ctx
6	Gemini 3 Flash Preview	Google	1,06T	—	Multimodal, academia/med
7	DeepSeek-V4-Pro	DeepSeek	1,00T	—	Matrix flagship (series 5,74T)
8	MiniMax M2.7	MiniMax	806B	—	Long context value
9	Grok 4.1 Fast	xAI	721B	—	2M ctx, legal strong
10	Step 3.5 Flash	StepFun	673B	—	Fast cheap batch

Vendor landscape: token share vs dollar — double truth

Смотреть только tokens — miss pricing gap. Anthropic — классический premium paradox: token share ~12% (год назад 25%, падает), dollar revenue ~46%. Enterprise платит premium за Claude, но traffic dominance уехала. Claude Opus 4.6 — ~$25M monthly revenue при token volume на порядки ниже DeepSeek.

Segment	Example	Token profile	Revenue profile
High-value · low traffic	Claude Opus series	Share declining	Complex reasoning, strong ARPU
Mid traffic · value	Google Gemini Flash	Steady growth	Multimodal, research
Ultra-cheap · high traffic	DeepSeek / MiniMax / StepFun	Rapid expansion	Agent, code, batch dominate

OpenRouter + a16z «2025 AI Usage»: benchmark score и market share часто обратно коррелируют. Devs оптимизируют inference cost, не peak capability; agent pipelines завязаны на API stability и latency. Отсюда DeepSeek/Hy3 на вершине при benchmark champions вне top 10.

6-step runbook: weekly OpenRouter tracking и routing updates

Chart обновляется каждую неделю — routing policy должна идти в ногу. Runbook для Claude Code, Cursor, OpenClaw или custom gateway: превращаем chart insight в config diff.

01
Каждый понедельник — Rankings: openrouter.ai/rankings — global total, China/USA share, top 10 delta; screenshot в team retro archive.
02
Разделить token и dollar: Revenue share рядом с token share; free model (Owl Alpha) ≠ prod default.
03
Scenario mapping: Agent/batch → DeepSeek-V4-Flash; enterprise reasoning → Claude Opus; multimodal → Gemini Flash; new entrants (Hy3, Owl Alpha) — early signal.
04
Fixed prompt suite regression: Еженедельно тот же issue subset, tool-call fail rate, сверка с weekly chart.
05
Routing JSON + budget circuit breaker: Flash tier — больше concurrency; Opus — hard monthly cap; fallback Sonnet → V4-Flash → human queue.
06
7×24 host для routing validation: Routing layer — anywhere; macOS stack (Claude Code, OpenClaw) — daemons на Mac Mini monthly rent, без laptop sleep на night runs.

json · weekly multi-model routing (concept)

{
  "weekly_review": "2026-05-24",
  "routes": {
    "agent_batch": "openrouter/deepseek/deepseek-v4-flash",
    "enterprise": "openrouter/anthropic/claude-sonnet-4.6",
    "complex_reasoning": "openrouter/anthropic/claude-opus-4.6",
    "multimodal": "openrouter/google/gemini-3-flash-preview",
    "experiment": "openrouter/owl-alpha"
  },
  "fallback": ["enterprise", "agent_batch"],
  "monthly_cap_usd": 800
}

Hard facts для memo и выбор agent host

Для internal memo / architecture review — OpenRouter public data + media cross-check, period 18–24 May 2026:

Global weekly: 28,9T tokens, +7,4% WoW, 5th growth week; year ago ~2,4T, ~12×/year.
DeepSeek matrix: V4-Flash 3,43T + V4-Pro 1,00T + V3.2 1,31T = 5,74T, vendor rank #1.
Coding share: OpenRouter + a16z: 11% (early 2025) → 50%+, largest category.
Anthropic premium: tokens ~12% vs dollars ~46%; Opus 4.6 ~$25M/month.
China share: early 2025 <2% → May 2026 ~45%+, 4 weeks ahead of USA.

OpenRouter решает inference vendor switch, но не process supervision, key boundary, Apple toolchain. Команды давят Flash cost до минимума и теряют night agent runs при закрытии lid — или упираются в Metal/Keychain на Linux VPS. Как в OpenRouter trends guide и аренде Mac Mini под OpenClaw: models reprice per token; host uptime — OpEx contract. Для multi-model routing + iOS CI + overnight agents VpsMesh Mac Mini M4 cloud rent обычно стабильнее personal machine. Тарифы: цены аренды Mac Mini M4, deploy: центр помощи.

FAQ

Частые вопросы

Weekly token volume = реальные платежи и prod traffic, market thermometer через money vote. Benchmarks — peak capability; OpenRouter + a16z часто показывают inverse correlation. Major model pick: weekly trends + private regression; monthly check openrouter.ai/rankings.

DeepSeek V4-Flash ~$0.10/$0.40 per M tokens — agent/batch scale hard, 3,43T за неделю; Claude 30–50× дороже, low token share, ~46% dollar revenue. Scenario-first, не «strongest model» chase — см. trends guide.

Не обязательно. Pure OpenRouter API — на Linux. Claude Code, Xcode или OpenClaw daemons — Mac Mini M4 monthly rent стабильнее. Месяц на weekly routing test — цены аренды, заказ оформить заказ, setup центр помощи.