Какая модель лидировала на OpenRouter в июне 2026?

По дневным токенам: DeepSeek V4 Flash — 619B, далее Tencent Hy3 Preview (451B) и MiniMax M3 (447B). По недельным токенам компаний DeepSeek лидирует с 17,6% доли.

DeepSeek лучше Claude?

Объём и качество — разные метрики. Китайские модели доминируют в рутине за счёт 8× ценового разрыва; Claude Opus 4.8 (индекс 61,4) остаётся #1 для самых сложных 5% agent-задач.

Какие frontier-модели выходят во второй половине 2026?

Высокая вероятность в Q3: GPT-6 (авг–сен), Claude Opus 5 (~сен), Gemini 4, DeepSeek V5 open weight, плюс уже вышедший GLM 5.2.

Рейтинг OpenRouter за июнь 2026: китайские модели — 61% трафика, на кого ставить во второй половине года

01

Всё ещё смотрите на рынок через призму 2025? Пять системных ошибок

OpenRouter агрегирует реальный API-трафик миллионов разработчиков — не vendor benchmarks, а production vote через код. К концу июня 2026 ось конкуренции сместилась к стабильным agent pipeline; китайские open-weight модели забрали 40 п.п. у US labs минимальной ценой за token.

01
Ranking = quality ranking: token volume измеряет экономику, не MMLU; разделяйте «volume champion» и «quality ceiling».
02
Игнор global dev vote: разработчики в US/EU/India выбирают DeepSeek, Xiaomi, MiniMax за price/latency/good-enough, не за флаг.
03
Single-model lock-in: в Q3 выходят GPT-6, Opus 5, Gemini 4, DeepSeek V5 — лидер сегодня может смениться за 90 дней.
04
Signal Fable 5: max quality score → export ban; US frontier лидирует по capability, availability — переменная.
05
Сменили API, host не тронули: routing на OpenRouter — тривиален; 7×24 daemon, Keychain, Xcode привязаны к macOS — см. multi-model routing gateway.

02

OpenRouter июнь 2026: рейтинг компаний и моделей

Срез на июнь 2026, источник OpenRouter Rankings. Это не «кто громче в прессе», а какие weights реально крутятся в prod.

По компаниям (недельный token volume)

#	Компания	Регион	Tokens/нед	Доля
1	DeepSeek	Китай	5.13T	17.6%
2	Anthropic	США	4.34T	14.8%
3	Google	США	3.66T	12.5%
4	OpenAI	США	2.46T	8.4%
5	Xiaomi	Китай	2.42T	8.3%
6	MiniMax	Китай	2.37T	8.1%
7	Tencent	Китай	2.36T	8.1%
8	Alibaba Qwen	Китай	1.26T	4.3%

Китайские вендоры из top-10 — ~46%; с Moonshot и др. суммарная доля китайских моделей >60%.

По моделям (дневной token volume, top 10)

#	Модель	Вендор	Tokens/день
1	DeepSeek V4 Flash	DeepSeek	619B
2	Hy3 Preview	Tencent	451B
3	MiniMax M3	MiniMax	447B
4	MiMo-V2.5	Xiaomi	327B
5	DeepSeek V4 Pro	DeepSeek	300B
6	Claude Opus 4.7	Anthropic	263B
7	Claude Opus 4.8	Anthropic	~200B
8	Claude Sonnet 4.6	Anthropic	178B
9	Gemini 3 Flash Preview	Google	156B
10	Kimi K2.6	Moonshot AI	~150B

Dev из San Diego: «Claude на coding — ~$10/час. DeepSeek — <50 центов.» Это не quality story, это unit economics.

03

Разворот за год: США 70%→30% — volume leader ≠ quality leader

Bloomberg/OpenRouter/Exponential View: июнь 2025 Google+OpenAI+Anthropic ~70% token share; июнь 2026 ~30%. 40 п.п. ушли китайским моделям — драйвер global dev community, не «патриотизм».

Quality ceiling: Claude Opus 4.8 — #1 Intelligence Index

Artificial Analysis Intelligence Index (конец мая 2026):

Модель	Intelligence Index	SWE-bench Pro	Примечание
Claude Opus 4.8	61.4 (#1)	69.2%	Long context + agent SOTA
GPT-5.5	59–60	63.1%	Ecosystem + tool calls
Gemini 3.1 Pro	57	—	Hard reasoning
Qwen 3.7 Max	57	—	CN closed-source flagship
Claude Sonnet 4.6	—	80.8% (Verified)	Writing + IF

Internal benchmark 20 tasks: Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4; на long-context Opus доминирует.

⚠

Claude Fable 5: max quality (100/100), SWE-bench Verified ~95%, глобально снят mid-июнь 2026 из-за export control — status TBD. US frontier лидирует по raw capability; доступность — risk factor.

Volume leaders: китайские модели через price/perf

Price: MiniMax M3 API $0.60/M input vs Claude Opus 4.8 $5.00/M — 1/8
Good enough: coding assist, completion, translate, summary — 80–90% top-tier quality
Open weights: DeepSeek V4, MiniMax M3 — self-host снимает data residency concerns, on-prem inference без egress в US cloud

04

Матрица 8 сценариев и roadmap Q3 2026

Сценарий	Модель	Почему
Сложный code / agent	Claude Opus 4.8	Index #1, long context
Ежедневный coding	DeepSeek V4 Flash / MiMo-V2.5	Price/perf, low latency
Max API value	MiniMax M3	$0.60/M, open weight, self-host
Long context	Kimi K2.6 (1M context)	Extreme window, fair price
Google stack	Gemini 3.5 Flash	Workspace native
Live web search	Grok 4.3	X/Twitter realtime
Self-hosted	GLM 5.2 / Kimi K2.6	Top open weights
Image gen	ChatGPT Images 2.0	Text rendering SOTA

Confirmed/high-probability Q3 2026

Модель	Вендор	Окно	Ключевое
GPT-6	OpenAI	авг–сен 2026	1.5M context, stronger agents
Claude Opus 5	Anthropic	~сен 2026	Long-horizon agent upgrade
Gemini 4	Google	Q3 2026	Multimodal, video/audio
DeepSeek V5	DeepSeek	Q3 2026	Open weight, >1T params
GLM 5.2	Z.ai	Released	Top open weight, coding
Grok 4.3+	xAI	Q3 2026	1M context, live web

Несколько релизов сожмутся в 6-недельное окно mid-aug — late sep — benchmark crown меняется быстрее media cycle.

05

5 макротрендов, hard data и 6-шаговый runbook

Макропрогноз H2 2026

Scenario fit > single SOTA: 5 labs за 90 дней — closed frontier на hardest 5%, CN open weights на 95% daily volume.
CN share растёт, enterprise cap: indie adoption без тормозов; Fortune 500 procurement ограничен data security и US regulation.
Agents — main battlefield: Anthropic State of AI Agents 2026: ~44% Claude API calls — math/CS; SWE-bench Pro и long-horizon completion rate решают enterprise budget.
IPO reshapes pricing: OpenAI и Anthropic в июне сигнализировали IPO — listing pressure ускорит tiered pricing, косвенный буст CN price war.
Local models → 80% SWE-bench: к 2027 32GB consumer GPU вероятно пробьёт 80% SWE-bench — давление на commercial coding API.

Цитируемые hard data (для internal memo)

US-CN flip: US labs OpenRouter share 70% (06/2025) → 30% (06/2026)
Price gap: MiniMax M3 $0.60/M vs Claude Opus 4.8 $5.00/M — ~8×
Quality #1: Claude Opus 4.8 index 61.4, SWE-bench Pro 69.2%
Volume #1: DeepSeek V4 Flash 619B tokens/day — 1.37× Hy3
Agent call mix: math+CS ~44% Anthropic API
DeepSeek V5 expected: open weight, >1T params, frontier-class

6-step runbook: model-swappable architecture

01
Task tiers: L1 draft (Flash/MiMo), L2 daily code (Sonnet/DeepSeek), L3 long agent (Opus 4.8/Kimi), L4 multimodal (Gemini/Grok).
02
Single OpenRouter endpoint: один Base URL, разный model; keys только в Keychain или CI secret.
03
Monthly hard caps: Opus tier $25/M output + circuit breaker; Flash tier — выше concurrency.
04
Fixed prompt regression: weekly один и тот же issue subset; track tool-call failure rate, не только TTFT.
05
Degradation chain: Opus 4.8 → Sonnet 4.6 → DeepSeek V4 Flash → manual queue.
06
Bind 7×24 host: routing в любом cloud; при Claude Code/Xcode/OpenClaw — daemon на арендованном Mac Mini, локально только review diff.

06

Margin compression в model layer: архитектура > конкретная модель

Тезис не «Китай победил», а margin model layer схлопывается. DeepSeek в начале 2025 показал: frontier не требует frontier compute — Xiaomi, Tencent, MiniMax, Moonshot скопировали и выбили base pricing в пол.

US стратегии расходятся: OpenAI — ecosystem play; Anthropic — quality moat (Opus agent); Google — speed + multimodal (Gemini Flash — лучший closed-source price/perf). Середина «не плохо, но дорого» исчезает.

Закрытый MacBook убивает nightly agent run; Linux VPS без Metal/Keychain/Xcode — integration cost часто ×2. Pure web API scripts — anywhere; при Claude Code + OpenClaw + iOS CI VpsMesh Mac Mini M4 cloud rental упаковывает uptime и native macOS path в monthly OpEx — дешевле, чем переустанавливать три CLI после каждого ranking shuffle. Тарифы: цены аренды Mac Mini M4, деплой: центр помощи.

FAQ

Три самых частых вопроса

По дневным tokens: DeepSeek V4 Flash (619B), далее Hy3 Preview (451B) и MiniMax M3 (447B). По недельным company tokens: DeepSeek — 17.6%. Полный рейтинг: openrouter.ai/rankings.

Зависит от task. Volume: CN models через 8× price gap; quality: Claude Opus 4.8 (index 61.4) для hardest agents. Стратегия: closed frontier на 5%, Flash tier на 95%. Routing guide: OpenClaw multi-model routing.

Pure OpenRouter API — нет. При Claude Code, Xcode или OpenClaw daemon аренда Mac Mini M4 стабильнее. Рекомендуем 1 месяц test — тарифы: цены аренды Mac Mini M4, заказ: оформить заказ.