GPT-5.6 Sol, Terra et Luna : revue complète, benchmarks, tarifs et guide d'accès (2026)

Sortie 26 juin · Tarifs Sol/Terra/Luna · TerminalBench 91,9 % · Preview gouvernementale · GA juillet · Runbook en six étapes

GPT-5.6 Sol Terra Luna benchmarks tarifs juin 2026

Si vous êtes développeur IA, acheteur API ou utilisateur Cursor/Codex et que vous vous demandez s'il faut ré-architecturer autour du lancement OpenAI du 26 juin, la réponse n'est pas simple : GPT-5.6 Sol, Terra et Luna arrivent avec des records TerminalBench et une nomenclature solaire, mais seules une vingtaine d'organisations partenaires agréées y accèdent aujourd'hui pendant le premier examen gouvernemental américain d'un modèle frontier. Cet article livre les faits de lancement vérifiés, les tarifs et modes Sol/Terra/Luna, des tableaux de benchmarks face à Claude Mythos 5, les mécanismes de sécurité, un calendrier d'accès juillet, des recommandations par cas d'usage et un runbook production en six étapes pour planifier sans parier votre stack sur un accès preview.

01

Pourquoi la semaine GPT-5.6 pose cinq problèmes concrets aux équipes production

En bref : OpenAI a dévoilé GPT-5.6 le 26 juin 2026 avec une nomenclature solaire — Sol (flagship), Terra (équilibré) et Luna (léger). Le mode Ultra multi-agents de Sol domine TerminalBench 2.1 à 91,9 %, détrônant Claude Mythos 5 après seulement 17 jours en tête. Pourtant l'accès ChatGPT et API reste à des semaines, et Polymarket cote la GA complète au 31 juillet à environ 87 %. Les équipes qui ont anticipé sur notre intelligence des fuites de juin font face à un autre problème : le modèle existe, mais la plupart des développeurs ne peuvent pas l'appeler.

Cinq freins à l'adoption immédiate

  1. 01

    Preview réservée aux partenaires : Seules ~20 organisations de confiance agréées par le gouvernement accèdent à Sol, Terra et Luna via API et Codex. Les utilisateurs ChatGPT grand public ne voient rien — des semaines avant la GA.

  2. 02

    Première restriction de lancement US : Le décret exécutif du 2 juin de Donald Trump a déclenché une demande de la Maison Blanche limitant le déploiement. C'est la première fois que Washington impose formellement un gate sur un modèle frontier — un précédent aux échos export-control pour le retrait de Fable 5 chez Anthropic.

  3. 03

    Économie token du mode Ultra : Le mode multi-agents Ultra de Sol alimente les records de benchmarks mais brûle nettement plus de tokens output que le mode standard — risque de dépasser les budgets si chaque requête passe par Ultra.

  4. 04

    Big Three bloqués en juin : OpenAI a preview-locké GPT-5.6, Anthropic a forcé Mythos 5 et Fable 5 offline le 12 juin, Google a repoussé Gemini 3.5 Pro à juillet. Aucun labo occidental n'a livré un flagship totalement ouvert ce mois-ci.

  5. 05

    Fiche système incomplète : SWE-Bench Pro et d'autres scores agentiques de GPT-5.6 ne sont pas entièrement publiés. La domination TerminalBench est vérifiée ; toute autre comparaison face à Claude reste provisoire.

Juin 2026 devait être le plus grand mois de lancements IA de l'histoire. Finalement, les trois familles frontier occidentales sont restées bloquées à la porte — preview lock, contrôle des exportations ou retard.

02

GPT-5.6 Sol, Terra et Luna : tarifs, modes et comparaison des modèles

OpenAI introduit pour la première fois une nomenclature céleste. Sol vise la capacité maximale avec les modes Max (lent, précis) et Ultra (multi-agents parallèles). Terra égale les performances GPT-5.5 à la moitié du coût de Sol. Luna est le tier budget — mais il a obtenu la classification cybersécurité « High » d'OpenAI, une première pour un non-flagship de la même famille.

ModèleIdéal pourInput / OutputContextePoint fort
GPT-5.6 SolCoding complexe, recherche sécurité, agents long horizon5 $ / 30 $ par 1M tokens~1,5M tokensModes Max + Ultra ; n°1 TerminalBench
GPT-5.6 TerraDocs entreprise, support, outils internes à volume2,50 $ / 15 $ par 1M tokens~1,5M tokensNiveau GPT-5.5 à 50 % moins cher
GPT-5.6 LunaRésumés, rédaction, automatisation routinière1 $ / 6 $ par 1M tokens~1,5M tokens80 % moins cher que Sol ; rating cyber High

Sol Max vs Ultra : quand utiliser chaque mode

  • Mode Max : Sol consacre plus de temps de raisonnement avant de répondre — plus lent, plus précis. À privilégier quand la justesse prime sur la latence.
  • Mode Ultra : Sol déploie plusieurs sous-agents qui divisent une tâche, exécutent en parallèle et fusionnent les résultats. Cette architecture a produit le record TerminalBench de 91,9 %. Réservez-le aux workflows agentiques réellement complexes ; la consommation token est nettement plus élevée.

Tarifs vs GPT-5.5 et Claude Fable 5

ModèleInputOutputNotes
GPT-5.6 Sol5 $/M30 $/MMême prix que GPT-5.5, performances bien supérieures
GPT-5.6 Terra2,50 $/M15 $/M50 % moins cher que Sol ; parité GPT-5.5
GPT-5.6 Luna1 $/M6 $/M80 % moins cher que Sol
Claude Fable 510 $/M50 $/MOffline depuis le 12 juin (contrôle exportations US)
03

Résultats benchmarks GPT-5.6 : TerminalBench, CTF et scores agentiques

GPT-5.6 est la première famille OpenAI où les trois tiers ont franchi la classification interne cybersécurité « High ». La domination est la plus nette sur le coding agentique et la recherche sécurité ; les scores sciences de la vie progressent aussi significativement vs GPT-5.5.

TerminalBench 2.1 (agents coding)

TerminalBench 2.1 exécute 89 défis de planification en ligne de commande — usage d'outils multi-étapes, réparation itérative et coordination de tâches plus proches du travail agent réel que la complétion de code en un shot.

ModèleScoreMode
GPT-5.6 Sol91,9 %Ultra (multi-agents)
GPT-5.6 Sol88,8 %Standard
Claude Mythos 588,0 %Standard
GPT-5.583,4 %Standard
Gemini 3.1 Pro Preview70,7 %Standard

Mythos 5 n'avait tenu la première place que 17 jours depuis son couronnement du 9 juin avant d'être dépassé par Sol.

Agent's Last Exam (tâches long horizon)

ModèleComplétion de tâche (mode code)
GPT-5.6 Sol50,9 % — seul modèle au-dessus de 50 %
GPT-5.6 LunaLégèrement au-dessus de GPT-5.5

Cybersécurité : CTF et ExploitBench

ModèleTaux CTF
Sol96,7 %
Terra91,84 %
Luna85,19 %

Sur ExploitBench, Sol égale le Mythos Preview d'Anthropic en utilisant environ un tiers des tokens output — capacité comparable en recherche de vulnérabilités à un coût nettement inférieur.

!

Frontière sécurité : Le red-teaming OpenAI confirme que Sol peut identifier des vulnérabilités et des primitives d'exploit dans les codebases Chromium et Firefox, mais ne peut pas construire de façon autonome des chaînes d'exploit complètes et fonctionnelles contre des cibles durcies. Il reste sous le seuil « Cyber Critical » d'OpenAI.

Sciences de la vie

  • GeneBench v1 : Sol égale ou dépasse GPT-5.5 sur la génomique et la biologie quantitative avec moins de tokens.
  • HealthBench Professional : Sol score 60,5+8,7 points vs GPT-5.5.
04

Verrou gouvernemental, retards Big Three et GPT-5.6 vs Claude Mythos 5

Décret Trump et première restriction de lancement

Le 2 juin 2026, Donald Trump a signé un décret exécutif accordant aux agences US jusqu'à 30 jours d'accès pré-lancement pour examiner les modèles IA frontier. Le 26 juin, suite à une demande de la Maison Blanche coordonnée par l'OSTP et l'Office of the National Cyber Director, OpenAI a accepté de limiter GPT-5.6 à environ 20 partenaires de confiance pré-approuvés. C'est la première fois que le gouvernement américain exige formellement qu'une entreprise IA restreigne la mise sur le marché d'un modèle.

OpenAI s'est exécutée mais a réagi publiquement : « Nous ne pensons pas que ce type de processus d'accès gouvernemental devrait devenir la norme à long terme. Il prive les utilisateurs, développeurs, entreprises, défenseurs cyber et partenaires mondiaux des meilleurs outils dont ils ont besoin. »

Big Three : tous bloqués en juin 2026

EntrepriseModèleStatut
OpenAIGPT-5.6 Sol / Terra / LunaPreview limitée (~20 orgs)
AnthropicClaude Fable 5 / Mythos 5Offline forcé 12 juin (export control)
GoogleGemini 3.5 ProRepoussé à juillet (initialement juin)

GPT-5.6 Sol vs Claude Mythos 5

DimensionGPT-5.6 SolClaude Mythos 5
TerminalBench 2.191,9 % (Ultra) / 88,8 % standard88,0 %
ExploitBenchQuasi-identique ; ~1/3 tokens outputFort (accès restreint)
Tarifs5 $ / 30 $ par 1M tokens10 $ / 50 $ (actuellement offline)
DisponibilitéPreview → GA sous quelques semainesOffline (export control US)
Fenêtre de contexte~1,5M tokens200K tokens

Sol mène sur TerminalBench et offre une capacité comparable en recherche sécurité à la moitié du prix de Fable 5. Mythos 5 peut encore mener sur SWE-Bench Pro jusqu'à publication de la fiche système complète par OpenAI.

Mécanismes de sécurité intégrés à GPT-5.6

  • Classificateurs de misuse en temps réel sur chaque output
  • Revue au niveau compte pour workflows sensibles
  • 700 000 heures GPU A100-équivalent de red-teaming automatisé
  • Tests jailbreak universels sur vecteurs d'attaque cross-prompt
  • Modèle de raisonnement large spécialisé filtre les réponses si les garde-fous primaires échouent
  • Revue par organisations sécurité externes avant lancement

Vitesse Cerebras : 750 tokens par seconde en juillet

À partir de juillet 2026, GPT-5.6 Sol se déploie sur matériel Cerebras pour certains clients enterprise à jusqu'à 750 tokens par seconde — environ 5× à 15× plus rapide que les 50–150 tok/s des modèles frontier actuels. Une réponse de 10 secondes pourrait tomber sous une seconde pour les assistants coding temps réel et les UI agent live.

i

Calendrier d'accès : Maintenant (~20 partenaires via API/Codex uniquement). Juillet 2026 : GA ChatGPT (Plus/Pro en premier), API publique et Sol accéléré Cerebras. Polymarket assigne environ 87 % de probabilité à une release large au 31 juillet.

05

Runbook en six étapes, cas d'usage et données citables pour l'adoption GPT-5.6

Ne ré-architectez pas la production sur un accès preview. Le runbook sépare les actions possibles aujourd'hui des vérifications post-GA une fois ChatGPT et les endpoints API ouverts largement.

Runbook production en six étapes

  1. 01

    Maintenez votre stack actuelle : Gardez GPT-5.5, Claude Opus 4.8 ou Sonnet 4.6 en production jusqu'à la GA API de Sol/Terra/Luna. Les scores preview ne garantissent pas les performances sur votre workload.

  2. 02

    Mappez les workloads par tier dès maintenant : Routez le coding agent complexe vers Sol (Ultra seulement si justifié), la logique métier à volume vers Terra, résumés et classification vers Luna. Documentez les budgets token avant que la GA fasse monter les coûts.

  3. 03

    Surveillez les signaux GA : Suivez openai.com/blog, platform.openai.com/docs et le contrat Polymarket du 31 juillet. Alertes status-page API le jour du lancement ChatGPT — historiquement 24–48 h avant l'API.

  4. 04

    Benchmark vos propres workloads post-GA : Exécutez des tâches multi-étapes type TerminalBench, génération frontend et retrieval long contexte sur Sol standard vs Ultra. N'assumez pas que les 91,9 % Ultra se transposent à votre structure de repo.

  5. 05

    Planifiez les tests latence Cerebras en juillet : Si le streaming sub-seconde compte (coding live, agents client-facing), filez l'accès enterprise Cerebras tôt — capacité initiale limitée.

  6. 06

    Maintenez un fallback multi-vendor : Juin a prouvé qu'aucun modèle frontier n'est disponible en permanence. Documentez l'exposition export-control pour le personnel étranger et gardez le routing Anthropic/OpenAI/Gemini dans votre gateway.

Quel modèle GPT-5.6 choisir ?

Votre besoinModèle recommandé
Agents coding complexes, workflows SWE multi-étapesSol (Ultra pour les tâches les plus dures)
Docs entreprise, tickets support, appels API à échelleTerra
Résumés, rédaction, automatisation routinièreLuna
Performances GPT-5.5 à moitié prixTerra
Apps sensibles à la latence après juilletSol sur Cerebras (750 tok/s)
bash
export PRIMARY_MODEL="gpt-5.5"
export PREVIEW_TARGET="gpt-5.6-sol"
export FALLBACK_MODELS="claude-opus-4-8,gpt-5.5,gemini/gemini-2.5-pro"
curl -s https://status.openai.com/api/v2/status.json | jq '.status.description'

Données citables (27 juin 2026)

  • TerminalBench 2.1 : GPT-5.6 Sol à 91,9 % (Ultra), 88,8 % standard — vs Mythos 5 88,0 %, GPT-5.5 83,4 %, Gemini 3.1 Pro Preview 70,7 %.
  • Taux CTF : Sol 96,7 %, Terra 91,84 %, Luna 85,19 % — première famille où les trois tiers atteignent la classification cyber « High ».
  • Cotes Polymarket GA : Environ 87 % de probabilité d'une release large GPT-5.6 au 31 juillet 2026.
  • Débit Cerebras : Jusqu'à 750 tok/s pour Sol en juillet — 5–15× plus rapide que les 50–150 tok/s frontier typiques.
  • HealthBench Professional : Sol 60,5 (+8,7 vs GPT-5.5).

Faire tourner des agents Sol Ultra sur un laptop signifie que les Background Agents s'arrêtent à la fermeture du capot, qu'un VPS Linux n'offre ni Metal ni les frontières Keychain pour Codex, et qu'une machine de dev partagée crée des collisions de clés API quand deux boucles agent tirent en parallèle. Courir après des modèles preview sur du hardware instable gaspille la semaine entre accès partenaire et GA de juillet. Pour les équipes qui ont besoin de Cloud Agents 24/7, Cursor Rules persistantes et chaînes de compilation capot fermé pendant qu'elles A/B testent Sol, Terra et Luna le jour de l'ouverture API, un Mac dédié bat le bricolage de fallbacks sur hardware personnel. La location cloud Mac Mini M4 VpsMesh livre fiabilité launchd, accès SSH et facturation mensuelle dans un seul nœud production — voir les tarifs de location, le centre d'aide pour le déploiement et la page de commande pour provisionner avant la GA de juillet.

FAQ

Sept questions que les développeurs recherchent en ce moment

Pas encore pour le grand public. Au 27 juin 2026, seules environ 20 organisations partenaires agréées accèdent à Sol, Terra et Luna via API et Codex. Le déploiement ChatGPT complet est attendu sous quelques semaines — Polymarket cote la GA du 31 juillet à environ 87 %.

Sol mène sur TerminalBench 2.1 à 91,9 % (Ultra) contre Claude Mythos 5 à 88 %. Fable 5 reste en tête sur SWE-Bench Pro, mais OpenAI n'a pas publié les scores SWE-Bench officiels de GPT-5.6. Sol offre un meilleur rapport qualité-prix — coding agentique comparable ou supérieur à environ la moitié du prix de Fable 5.

Le mode Ultra déploie plusieurs sous-agents IA qui divisent une tâche complexe, exécutent en parallèle et synthétisent un résultat unifié. Il a produit le record TerminalBench de 91,9 % mais consomme nettement plus de tokens que le mode standard — à réserver aux workflows agentiques réellement difficiles.

Suite au décret exécutif du 2 juin 2026 de Donald Trump, la Maison Blanche a demandé à OpenAI de limiter GPT-5.6 pendant un examen de sécurité gouvernemental. C'est la première fois que Washington impose formellement une restriction de lancement. OpenAI s'est exécutée mais s'oppose à ce que cela devienne une pratique permanente.

Jusqu'à 750 tokens par seconde pour GPT-5.6 Sol sur Cerebras à partir de juillet 2026 — environ 5–15× plus rapide que la plupart des modèles frontier actuels à 50–150 tok/s. L'accès initial est limité à certains clients enterprise.

Environ 1,5 million de tokens pour Sol, Terra et Luna — contre 1M pour GPT-5.5. Confirmation officielle attendue avec la fiche système complète à la disponibilité générale.

Maintenez GPT-5.5 ou Claude Opus 4.8 en production, mais provisionnez un Mac 24/7 pour benchmarker Sol/Terra/Luna dès l'ouverture des endpoints. Voir les tarifs location Mac Mini M4 et le centre d'aide pour les étapes de déploiement.