Classement OpenRouter juin 2026 : les modèles chinois captent 61 % du trafic — que parier pour H2 ?

Part US 70→30 % · volume≠qualité · matrice 8 scénarios · feuille de route Q3 · architecture en 6 étapes

Classement OpenRouter juin 2026 : analyse du trafic des modèles chinois

En juin 2026, trois signaux convergent : Claude Fable 5 retiré pour contrôle des exportations, OpenAI et Anthropic évoquent une IPO, et les modèles chinois dépassent 60 % des tokens sur OpenRouter. Si vous choisissez encore vos LLM avec le cadre de 2025, vous sous-estimez le basculement. Cet article s'appuie sur le trafic temps réel OpenRouter, l'Artificial Analysis Intelligence Index et SWE-bench Pro pour livrer le double classement (entreprises et modèles), l'interprétation 70 %→30 % pour les États-Unis, la séparation volume/qualité, une matrice en 8 scénarios, la feuille de route Q3, cinq tendances macro et un runbook en six étapes pour une architecture indépendante du modèle — avec le rôle du Mac Mini M4 en location mensuelle pour les agents 7×24.

01

Encore le réflexe 2025 ? Cinq angles morts sur le marché IA

OpenRouter agrège le trafic API réel de millions de développeurs — pas les benchmarks marketing, mais le vote du code en production. Fin juin 2026, l'équilibre a basculé : la compétition porte sur la fiabilité des agents, tandis que les modèles open source chinois captent 40 points de parts américaines à prix plancher.

  1. 01

    Confondre classement et qualité : le volume de tokens reflète un choix économique, pas le score MMLU ; distinguez « champion du trafic » et « plafond qualité ».

  2. 02

    Ignorer le vote global : développeurs US, UE et Inde choisissent DeepSeek, Xiaomi, MiniMax pour le prix, la vitesse, la suffisance — pas la nationalité.

  3. 03

    Verrouillage sur un seul modèle : le Q3 amène GPT-6, Opus 5, Gemini 4, DeepSeek V5 — le leader d'aujourd'hui peut changer en trois mois.

  4. 04

    Sous-estimer le signal Fable 5 : note maximale puis retrait export — la frontier US mène techniquement, l'accessibilité devient variable.

  5. 05

    Changer d'API sans changer d'hôte : le routage OpenRouter est trivial ; daemons 7×24, Keychain, Xcode restent liés à macOS — voir le guide de routage multi-modèles.

02

OpenRouter juin 2026 : double classement entreprises et modèles

Données à fin juin 2026, source OpenRouter Rankings. Ce classement révèle quel modèle les équipes font réellement tourner en production.

Par entreprise (tokens hebdomadaires)

RangEntrepriseOrigineTokens/semainePart
1DeepSeekChine5,13T17,6 %
2AnthropicÉtats-Unis4,34T14,8 %
3GoogleÉtats-Unis3,66T12,5 %
4OpenAIÉtats-Unis2,46T8,4 %
5XiaomiChine2,42T8,3 %
6MiniMaxChine2,37T8,1 %
7TencentChine2,36T8,1 %
8Alibaba QwenChine1,26T4,3 %

Les éditeurs chinois listés dans le top 10 totalisent environ 46 % ; avec Moonshot et autres, la part chinoise dépasse 60 %.

Par modèle (tokens quotidiens, top 10)

RangModèleÉditeurTokens/jour
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Témoignage d'un développeur de San Diego : « Avec Claude, le code coûte environ 10 $ de l'heure. Avec DeepSeek, moins de 50 cents. » — Ce n'est pas une histoire de qualité, c'est une histoire d'économie.

03

Renversement en un an : les US passent de 70 % à 30 % — volume ≠ qualité

Bloomberg, OpenRouter et Exponential View confirment le basculement : en juin 2025, Google + OpenAI + Anthropic totalisaient ~70 % des tokens ; en juin 2026, ~30 %. Les 40 points perdus vont aux modèles chinois — portés par des développeurs du monde entier.

Plafond qualité : Claude Opus 4.8 reste #1

Selon l'Artificial Analysis Intelligence Index (fin mai 2026) :

ModèleIndex qualitéSWE-bench ProRemarque
Claude Opus 4.861,4 (#1)69,2 %Long contexte et agents
GPT-5.559–6063,1 %Écosystème et tool calls
Gemini 3.1 Pro57Raisonnement complexe
Qwen 3.7 Max57Flagship chinois closed source
Claude Sonnet 4.680,8 % (Verified)Rédaction et instructions

Test interne sur 20 tâches : Opus 4.8 en remporte 16, GPT-5.5 cinq, Gemini 3.1 Pro quatre ; sur le long contexte, Opus domine.

Claude Fable 5 avait obtenu la note maximale (100/100), SWE-bench Verified ~95 %, puis a été retiré mondialement mi-juin 2026 pour contrôle des exportations — statut incertain. La frontier US mène en capacité pure ; l'accès devient un risque.

Champions du volume : les modèles chinois par le rapport qualité-prix

  • Prix : MiniMax M3 API à 0,60 $/M token entrée vs Claude Opus 4.8 5,00 $/M — soit 1/8
  • Suffisance : aide au code, complétion, traduction, résumé atteignent 80–90 % des modèles premium
  • Open weight : DeepSeek V4, MiniMax M3 en poids ouverts — déploiement on-premise pour lever les craintes de confidentialité des données
04

Matrice 8 scénarios et feuille de route Q3 2026

ScénarioModèle recommandéJustification
Code complexe / agentClaude Opus 4.8Index #1, long contexte
Programmation quotidienneDeepSeek V4 Flash / MiMo-V2.5Rapport qualité-prix, faible latence
API ultra-compétitiveMiniMax M30,60 $/M, open weight, self-host
Long contexteKimi K2.6 (1M context)Fenêtre étendue, prix raisonnable
Écosystème GoogleGemini 3.5 FlashIntégration Workspace native
Recherche web temps réelGrok 4.3Flux X/Twitter en direct
Déploiement localGLM 5.2 / Kimi K2.6Meilleurs open weights
Génération d'imagesChatGPT Images 2.0Rendu texte leader

Sorties confirmées ou très probables au Q3 2026

ModèleÉditeurFenêtrePoint clé
GPT-6OpenAIaoût–sept. 20261,5M contexte, agents renforcés
Claude Opus 5Anthropic~sept. 2026Agents longue durée
Gemini 4GoogleQ3 2026Multimodal, vidéo/audio
DeepSeek V5DeepSeekQ3 2026Open weight, >1T paramètres
GLM 5.2Z.aiPubliéTop open weight, code
Grok 4.3+xAIQ3 20261M contexte, web live

Plusieurs lancements se concentrent dans une fenêtre de six semaines mi-août à fin septembre — la couronne benchmark changera plus vite que les cycles médias.

05

Cinq tendances macro, données citables et runbook en six étapes

Prévisions macro S2 2026

  • Compétition par scénario : cinq labs publient en 90 jours — closed frontier pour les 5 % les plus durs, open weights chinois pour 95 % du volume courant.
  • Part chinoise en hausse, plafond enterprise : adoption individuelle intacte ; achats Fortune 500 contraints par sécurité des données et régulation US.
  • Les agents sont le vrai champ de bataille : rapport Anthropic 2026 : ~44 % des appels Claude API en maths/informatique ; SWE-bench Pro et tâches longues décident les budgets.
  • IPO et pricing : OpenAI et Anthropic ont évoqué une IPO en juin — pression boursière accélère le tiered pricing, avantage indirect pour la guerre des prix chinoise.
  • Modèles locaux proches de 80 % SWE-bench : d'ici 2027, un GPU 32 Go pourrait dépasser 80 % SWE-bench — pression sur les API commerciales de code.

Données citables (mémos internes)

  • Renversement US-Chine : part US OpenRouter 70 % (06/2025) → 30 % (06/2026)
  • Écart de prix : MiniMax M3 0,60 $/M vs Claude Opus 4.8 5,00 $/M — environ
  • Qualité #1 : Claude Opus 4.8 index 61,4, SWE-bench Pro 69,2 %
  • Volume #1 : DeepSeek V4 Flash 619B tokens/jour — 1,37× Hy3
  • Structure appels agents : maths+info ~44 % des appels Anthropic
  • DeepSeek V5 attendu : open weight, >1T paramètres, niveau frontier

Runbook en six étapes : architecture interchangeable

  1. 01

    Niveaux de tâche : L1 brouillon (Flash/MiMo), L2 code courant (Sonnet/DeepSeek), L3 agent long (Opus 4.8/Kimi), L4 multimodal (Gemini/Grok).

  2. 02

    Endpoint OpenRouter unique : même Base URL, champ model différent ; clés en Keychain ou secret CI.

  3. 03

    Plafonds mensuels : tier Opus $25/M sortie avec circuit breaker ; tier Flash concurrency plus large.

  4. 04

    Régression prompts fixes : chaque semaine, même sous-ensemble d'issues agent ; mesurer échecs tool call, pas seulement TTFT.

  5. 05

    Chaîne de dégradation : Opus 4.8 → Sonnet 4.6 → DeepSeek V4 Flash → file manuelle.

  6. 06

    Hôte 7×24 : routage en cloud ; si Claude Code, Xcode, OpenClaw, déployer les daemons sur Mac Mini loué, valider les diffs en local.

06

Marges comprimées : l'architecture vaut plus que le modèle

La leçon n'est pas « la Chine gagne », mais la marge du layer modèle s'effondre. DeepSeek a montré début 2025 qu'il ne faut pas de compute frontier pour un modèle frontier — Xiaomi, Tencent, MiniMax, Moonshot ont suivi et ont écrasé les prix de base.

Stratégies US divergentes : OpenAI mise sur l'écosystème ; Anthropic défend la qualité (Opus agent) ; Google sur vitesse et multimodal (Gemini Flash, meilleur closed source qualité-prix). La zone « pas mauvais mais cher » disparaît.

Fermer un MacBook interrompt les agents nocturnes ; un VPS Linux manque de Metal, Keychain et Xcode — coût d'intégration souvent doublé. Les scripts API purs peuvent rester n'importe où ; avec Claude Code + OpenClaw + CI iOS, la location cloud Mac Mini M4 VpsMesh regroupe uptime et chemins macOS natifs en OpEx mensuel — moins cher que réinstaller trois CLI à chaque reshuffle de classement. Tarifs : tarifs Mac Mini M4, déploiement : centre d'aide.

FAQ

Les trois questions les plus fréquentes

Par tokens quotidiens : DeepSeek V4 Flash (619B), puis Hy3 Preview (451B) et MiniMax M3 (447B). Par entreprise hebdomadaire : DeepSeek à 17,6 %. Classement complet : openrouter.ai/rankings.

Selon la tâche. Volume : modèles chinois via écart 8× ; qualité : Claude Opus 4.8 (index 61,4) pour les agents les plus difficiles. Stratégie : closed frontier pour 5 %, tier Flash pour 95 %. Guide routage : OpenClaw multi-modèles.

API OpenRouter seule : non. Avec Claude Code, Xcode ou daemons OpenClaw, la location mensuelle Mac Mini M4 est plus stable. Testez un mois — tarifs : tarifs Mac Mini M4, commande : page de commande.