Рейтинг OpenRouter за июнь 2026: китайские модели — 61% трафика, на кого ставить во второй половине года

Доля США 70→30% · объём≠качество · матрица 8 сценариев · roadmap Q3 · 6-шаговая архитектура

Рейтинг OpenRouter июнь 2026: анализ трафика китайских моделей

В июне 2026 три события совпали: Claude Fable 5 снят из-за экспортного контроля, OpenAI и Anthropic сигнализируют об IPO, китайские модели на OpenRouter пробили 60% token share. Если вы выбираете LLM по схеме 2025 года — вы уже отстаёте. Разбор на базе real-time traffic OpenRouter, Artificial Analysis Intelligence Index и SWE-bench Pro: двойной рейтинг (компании + модели), интерпретация 70%→30% для США, разделение объём/качество, матрица 8 сценариев, roadmap Q3, 5 макротрендов, 6-шаговый runbook model-agnostic архитектуры и аргумент, почему аренда Mac Mini M4 стабильнее ноутбука для 7×24 agent daemon.

01

Всё ещё смотрите на рынок через призму 2025? Пять системных ошибок

OpenRouter агрегирует реальный API-трафик миллионов разработчиков — не vendor benchmarks, а production vote через код. К концу июня 2026 ось конкуренции сместилась к стабильным agent pipeline; китайские open-weight модели забрали 40 п.п. у US labs минимальной ценой за token.

  1. 01

    Ranking = quality ranking: token volume измеряет экономику, не MMLU; разделяйте «volume champion» и «quality ceiling».

  2. 02

    Игнор global dev vote: разработчики в US/EU/India выбирают DeepSeek, Xiaomi, MiniMax за price/latency/good-enough, не за флаг.

  3. 03

    Single-model lock-in: в Q3 выходят GPT-6, Opus 5, Gemini 4, DeepSeek V5 — лидер сегодня может смениться за 90 дней.

  4. 04

    Signal Fable 5: max quality score → export ban; US frontier лидирует по capability, availability — переменная.

  5. 05

    Сменили API, host не тронули: routing на OpenRouter — тривиален; 7×24 daemon, Keychain, Xcode привязаны к macOS — см. multi-model routing gateway.

02

OpenRouter июнь 2026: рейтинг компаний и моделей

Срез на июнь 2026, источник OpenRouter Rankings. Это не «кто громче в прессе», а какие weights реально крутятся в prod.

По компаниям (недельный token volume)

#КомпанияРегионTokens/недДоля
1DeepSeekКитай5.13T17.6%
2AnthropicСША4.34T14.8%
3GoogleСША3.66T12.5%
4OpenAIСША2.46T8.4%
5XiaomiКитай2.42T8.3%
6MiniMaxКитай2.37T8.1%
7TencentКитай2.36T8.1%
8Alibaba QwenКитай1.26T4.3%

Китайские вендоры из top-10 — ~46%; с Moonshot и др. суммарная доля китайских моделей >60%.

По моделям (дневной token volume, top 10)

#МодельВендорTokens/день
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Dev из San Diego: «Claude на coding — ~$10/час. DeepSeek — <50 центов.» Это не quality story, это unit economics.

03

Разворот за год: США 70%→30% — volume leader ≠ quality leader

Bloomberg/OpenRouter/Exponential View: июнь 2025 Google+OpenAI+Anthropic ~70% token share; июнь 2026 ~30%. 40 п.п. ушли китайским моделям — драйвер global dev community, не «патриотизм».

Quality ceiling: Claude Opus 4.8 — #1 Intelligence Index

Artificial Analysis Intelligence Index (конец мая 2026):

МодельIntelligence IndexSWE-bench ProПримечание
Claude Opus 4.861.4 (#1)69.2%Long context + agent SOTA
GPT-5.559–6063.1%Ecosystem + tool calls
Gemini 3.1 Pro57Hard reasoning
Qwen 3.7 Max57CN closed-source flagship
Claude Sonnet 4.680.8% (Verified)Writing + IF

Internal benchmark 20 tasks: Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4; на long-context Opus доминирует.

Claude Fable 5: max quality (100/100), SWE-bench Verified ~95%, глобально снят mid-июнь 2026 из-за export control — status TBD. US frontier лидирует по raw capability; доступность — risk factor.

Volume leaders: китайские модели через price/perf

  • Price: MiniMax M3 API $0.60/M input vs Claude Opus 4.8 $5.00/M1/8
  • Good enough: coding assist, completion, translate, summary — 80–90% top-tier quality
  • Open weights: DeepSeek V4, MiniMax M3 — self-host снимает data residency concerns, on-prem inference без egress в US cloud
04

Матрица 8 сценариев и roadmap Q3 2026

СценарийМодельПочему
Сложный code / agentClaude Opus 4.8Index #1, long context
Ежедневный codingDeepSeek V4 Flash / MiMo-V2.5Price/perf, low latency
Max API valueMiniMax M3$0.60/M, open weight, self-host
Long contextKimi K2.6 (1M context)Extreme window, fair price
Google stackGemini 3.5 FlashWorkspace native
Live web searchGrok 4.3X/Twitter realtime
Self-hostedGLM 5.2 / Kimi K2.6Top open weights
Image genChatGPT Images 2.0Text rendering SOTA

Confirmed/high-probability Q3 2026

МодельВендорОкноКлючевое
GPT-6OpenAIавг–сен 20261.5M context, stronger agents
Claude Opus 5Anthropic~сен 2026Long-horizon agent upgrade
Gemini 4GoogleQ3 2026Multimodal, video/audio
DeepSeek V5DeepSeekQ3 2026Open weight, >1T params
GLM 5.2Z.aiReleasedTop open weight, coding
Grok 4.3+xAIQ3 20261M context, live web

Несколько релизов сожмутся в 6-недельное окно mid-aug — late sep — benchmark crown меняется быстрее media cycle.

05

5 макротрендов, hard data и 6-шаговый runbook

Макропрогноз H2 2026

  • Scenario fit > single SOTA: 5 labs за 90 дней — closed frontier на hardest 5%, CN open weights на 95% daily volume.
  • CN share растёт, enterprise cap: indie adoption без тормозов; Fortune 500 procurement ограничен data security и US regulation.
  • Agents — main battlefield: Anthropic State of AI Agents 2026: ~44% Claude API calls — math/CS; SWE-bench Pro и long-horizon completion rate решают enterprise budget.
  • IPO reshapes pricing: OpenAI и Anthropic в июне сигнализировали IPO — listing pressure ускорит tiered pricing, косвенный буст CN price war.
  • Local models → 80% SWE-bench: к 2027 32GB consumer GPU вероятно пробьёт 80% SWE-bench — давление на commercial coding API.

Цитируемые hard data (для internal memo)

  • US-CN flip: US labs OpenRouter share 70% (06/2025) → 30% (06/2026)
  • Price gap: MiniMax M3 $0.60/M vs Claude Opus 4.8 $5.00/M — ~
  • Quality #1: Claude Opus 4.8 index 61.4, SWE-bench Pro 69.2%
  • Volume #1: DeepSeek V4 Flash 619B tokens/day — 1.37× Hy3
  • Agent call mix: math+CS ~44% Anthropic API
  • DeepSeek V5 expected: open weight, >1T params, frontier-class

6-step runbook: model-swappable architecture

  1. 01

    Task tiers: L1 draft (Flash/MiMo), L2 daily code (Sonnet/DeepSeek), L3 long agent (Opus 4.8/Kimi), L4 multimodal (Gemini/Grok).

  2. 02

    Single OpenRouter endpoint: один Base URL, разный model; keys только в Keychain или CI secret.

  3. 03

    Monthly hard caps: Opus tier $25/M output + circuit breaker; Flash tier — выше concurrency.

  4. 04

    Fixed prompt regression: weekly один и тот же issue subset; track tool-call failure rate, не только TTFT.

  5. 05

    Degradation chain: Opus 4.8 → Sonnet 4.6 → DeepSeek V4 Flash → manual queue.

  6. 06

    Bind 7×24 host: routing в любом cloud; при Claude Code/Xcode/OpenClaw — daemon на арендованном Mac Mini, локально только review diff.

06

Margin compression в model layer: архитектура > конкретная модель

Тезис не «Китай победил», а margin model layer схлопывается. DeepSeek в начале 2025 показал: frontier не требует frontier compute — Xiaomi, Tencent, MiniMax, Moonshot скопировали и выбили base pricing в пол.

US стратегии расходятся: OpenAI — ecosystem play; Anthropic — quality moat (Opus agent); Google — speed + multimodal (Gemini Flash — лучший closed-source price/perf). Середина «не плохо, но дорого» исчезает.

Закрытый MacBook убивает nightly agent run; Linux VPS без Metal/Keychain/Xcode — integration cost часто ×2. Pure web API scripts — anywhere; при Claude Code + OpenClaw + iOS CI VpsMesh Mac Mini M4 cloud rental упаковывает uptime и native macOS path в monthly OpEx — дешевле, чем переустанавливать три CLI после каждого ranking shuffle. Тарифы: цены аренды Mac Mini M4, деплой: центр помощи.

FAQ

Три самых частых вопроса

По дневным tokens: DeepSeek V4 Flash (619B), далее Hy3 Preview (451B) и MiniMax M3 (447B). По недельным company tokens: DeepSeek — 17.6%. Полный рейтинг: openrouter.ai/rankings.

Зависит от task. Volume: CN models через 8× price gap; quality: Claude Opus 4.8 (index 61.4) для hardest agents. Стратегия: closed frontier на 5%, Flash tier на 95%. Routing guide: OpenClaw multi-model routing.

Pure OpenRouter API — нет. При Claude Code, Xcode или OpenClaw daemon аренда Mac Mini M4 стабильнее. Рекомендуем 1 месяц test — тарифы: цены аренды Mac Mini M4, заказ: оформить заказ.