Доля США 70→30% · объём≠качество · матрица 8 сценариев · roadmap Q3 · 6-шаговая архитектура
В июне 2026 три события совпали: Claude Fable 5 снят из-за экспортного контроля, OpenAI и Anthropic сигнализируют об IPO, китайские модели на OpenRouter пробили 60% token share. Если вы выбираете LLM по схеме 2025 года — вы уже отстаёте. Разбор на базе real-time traffic OpenRouter, Artificial Analysis Intelligence Index и SWE-bench Pro: двойной рейтинг (компании + модели), интерпретация 70%→30% для США, разделение объём/качество, матрица 8 сценариев, roadmap Q3, 5 макротрендов, 6-шаговый runbook model-agnostic архитектуры и аргумент, почему аренда Mac Mini M4 стабильнее ноутбука для 7×24 agent daemon.
OpenRouter агрегирует реальный API-трафик миллионов разработчиков — не vendor benchmarks, а production vote через код. К концу июня 2026 ось конкуренции сместилась к стабильным agent pipeline; китайские open-weight модели забрали 40 п.п. у US labs минимальной ценой за token.
Ranking = quality ranking: token volume измеряет экономику, не MMLU; разделяйте «volume champion» и «quality ceiling».
Игнор global dev vote: разработчики в US/EU/India выбирают DeepSeek, Xiaomi, MiniMax за price/latency/good-enough, не за флаг.
Single-model lock-in: в Q3 выходят GPT-6, Opus 5, Gemini 4, DeepSeek V5 — лидер сегодня может смениться за 90 дней.
Signal Fable 5: max quality score → export ban; US frontier лидирует по capability, availability — переменная.
Сменили API, host не тронули: routing на OpenRouter — тривиален; 7×24 daemon, Keychain, Xcode привязаны к macOS — см. multi-model routing gateway.
Срез на июнь 2026, источник OpenRouter Rankings. Это не «кто громче в прессе», а какие weights реально крутятся в prod.
| # | Компания | Регион | Tokens/нед | Доля |
|---|---|---|---|---|
| 1 | DeepSeek | Китай | 5.13T | 17.6% |
| 2 | Anthropic | США | 4.34T | 14.8% |
| 3 | США | 3.66T | 12.5% | |
| 4 | OpenAI | США | 2.46T | 8.4% |
| 5 | Xiaomi | Китай | 2.42T | 8.3% |
| 6 | MiniMax | Китай | 2.37T | 8.1% |
| 7 | Tencent | Китай | 2.36T | 8.1% |
| 8 | Alibaba Qwen | Китай | 1.26T | 4.3% |
Китайские вендоры из top-10 — ~46%; с Moonshot и др. суммарная доля китайских моделей >60%.
| # | Модель | Вендор | Tokens/день |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Dev из San Diego: «Claude на coding — ~$10/час. DeepSeek — <50 центов.» Это не quality story, это unit economics.
Bloomberg/OpenRouter/Exponential View: июнь 2025 Google+OpenAI+Anthropic ~70% token share; июнь 2026 ~30%. 40 п.п. ушли китайским моделям — драйвер global dev community, не «патриотизм».
Artificial Analysis Intelligence Index (конец мая 2026):
| Модель | Intelligence Index | SWE-bench Pro | Примечание |
|---|---|---|---|
| Claude Opus 4.8 | 61.4 (#1) | 69.2% | Long context + agent SOTA |
| GPT-5.5 | 59–60 | 63.1% | Ecosystem + tool calls |
| Gemini 3.1 Pro | 57 | — | Hard reasoning |
| Qwen 3.7 Max | 57 | — | CN closed-source flagship |
| Claude Sonnet 4.6 | — | 80.8% (Verified) | Writing + IF |
Internal benchmark 20 tasks: Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4; на long-context Opus доминирует.
Claude Fable 5: max quality (100/100), SWE-bench Verified ~95%, глобально снят mid-июнь 2026 из-за export control — status TBD. US frontier лидирует по raw capability; доступность — risk factor.
| Сценарий | Модель | Почему |
|---|---|---|
| Сложный code / agent | Claude Opus 4.8 | Index #1, long context |
| Ежедневный coding | DeepSeek V4 Flash / MiMo-V2.5 | Price/perf, low latency |
| Max API value | MiniMax M3 | $0.60/M, open weight, self-host |
| Long context | Kimi K2.6 (1M context) | Extreme window, fair price |
| Google stack | Gemini 3.5 Flash | Workspace native |
| Live web search | Grok 4.3 | X/Twitter realtime |
| Self-hosted | GLM 5.2 / Kimi K2.6 | Top open weights |
| Image gen | ChatGPT Images 2.0 | Text rendering SOTA |
| Модель | Вендор | Окно | Ключевое |
|---|---|---|---|
| GPT-6 | OpenAI | авг–сен 2026 | 1.5M context, stronger agents |
| Claude Opus 5 | Anthropic | ~сен 2026 | Long-horizon agent upgrade |
| Gemini 4 | Q3 2026 | Multimodal, video/audio | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Open weight, >1T params |
| GLM 5.2 | Z.ai | Released | Top open weight, coding |
| Grok 4.3+ | xAI | Q3 2026 | 1M context, live web |
Несколько релизов сожмутся в 6-недельное окно mid-aug — late sep — benchmark crown меняется быстрее media cycle.
Task tiers: L1 draft (Flash/MiMo), L2 daily code (Sonnet/DeepSeek), L3 long agent (Opus 4.8/Kimi), L4 multimodal (Gemini/Grok).
Single OpenRouter endpoint: один Base URL, разный model; keys только в Keychain или CI secret.
Monthly hard caps: Opus tier $25/M output + circuit breaker; Flash tier — выше concurrency.
Fixed prompt regression: weekly один и тот же issue subset; track tool-call failure rate, не только TTFT.
Degradation chain: Opus 4.8 → Sonnet 4.6 → DeepSeek V4 Flash → manual queue.
Bind 7×24 host: routing в любом cloud; при Claude Code/Xcode/OpenClaw — daemon на арендованном Mac Mini, локально только review diff.
Тезис не «Китай победил», а margin model layer схлопывается. DeepSeek в начале 2025 показал: frontier не требует frontier compute — Xiaomi, Tencent, MiniMax, Moonshot скопировали и выбили base pricing в пол.
US стратегии расходятся: OpenAI — ecosystem play; Anthropic — quality moat (Opus agent); Google — speed + multimodal (Gemini Flash — лучший closed-source price/perf). Середина «не плохо, но дорого» исчезает.
Закрытый MacBook убивает nightly agent run; Linux VPS без Metal/Keychain/Xcode — integration cost часто ×2. Pure web API scripts — anywhere; при Claude Code + OpenClaw + iOS CI VpsMesh Mac Mini M4 cloud rental упаковывает uptime и native macOS path в monthly OpEx — дешевле, чем переустанавливать три CLI после каждого ranking shuffle. Тарифы: цены аренды Mac Mini M4, деплой: центр помощи.
По дневным tokens: DeepSeek V4 Flash (619B), далее Hy3 Preview (451B) и MiniMax M3 (447B). По недельным company tokens: DeepSeek — 17.6%. Полный рейтинг: openrouter.ai/rankings.
Зависит от task. Volume: CN models через 8× price gap; quality: Claude Opus 4.8 (index 61.4) для hardest agents. Стратегия: closed frontier на 5%, Flash tier на 95%. Routing guide: OpenClaw multi-model routing.
Pure OpenRouter API — нет. При Claude Code, Xcode или OpenClaw daemon аренда Mac Mini M4 стабильнее. Рекомендуем 1 месяц test — тарифы: цены аренды Mac Mini M4, заказ: оформить заказ.