14 outils gratuits · fenêtre migration 18 juin · APIs Chine sans proxy · runbook en six étapes
Si les abonnements mensuels à Claude Pro, Cursor Pro ou Copilot grignotent votre budget sans que vous souhaitiez dégrader votre stack de codage IA, le paysage des tokens gratuits en juin 2026 est plus riche que la plupart des développeurs ne l'imaginent : l'OAuth Gemini CLI offre 1 000 requêtes par jour, SiliconFlow accorde 20M tokens à l'inscription, et GitHub Copilot Student représente 10 $/mois à coût nul. Ce guide s'adresse aux développeurs indépendants et aux étudiants. Vous y trouverez un tableau comparatif de 14 outils gratuits, cinq pièges de quota décryptés, des combinaisons CLI internationales et APIs Chine sans proxy, un runbook en six étapes à coût zéro, et un cadre de décision pour l'hébergement Agent 24 h/24 sur Mac loué.
En 2026, « gratuit » se décline en trois catégories distinctes : les outils gratuits connectés à des APIs payantes (OpenCode, OpenClaw), les crédits API accordés par les fournisseurs (SiliconFlow, Alibaba Bailian), et les quotas OAuth inclus dans des abonnements (Gemini CLI, Codex CLI). Combiner ces trois voies permet de ramener le coût mensuel d'inférence vers zéro. Gratuit ne signifie pas illimité — pièges de quota, rétrogradations silencieuses de modèle et changements de politique soudains constituent les coûts cachés.
L'échéance la plus urgente est le 18 juin 2026 : Google a annoncé que le parcours OAuth gratuit de Gemini CLI cessera de servir les utilisateurs personnels, qui devront migrer vers Antigravity CLI. Il ne reste que quelques jours : si vous n'avez pas encore effectué la connexion OAuth et pratiqué le changement de modèle via /model, c'est votre dernière fenêtre. Consultez notre analyse du changement de politique Gemini CLI pour la chronologie complète.
Pièges de quota : le forfait gratuit Gemini API offre Flash à 1 500 requêtes par jour mais Pro seulement à 100. Les prompts à large contexte peuvent atteindre les limites RPM après 4 à 15 appels — l'expérience réelle diverge fortement du discours marketing.
Rétrogradations silencieuses : les comptes gratuits peuvent être routés vers Flash-Lite ou des modèles plus anciens aux heures de pointe, sans avertissement. Exécutez /stats model proactivement pour vérifier le modèle réellement utilisé.
Risque de changement de politique : GitHub Copilot est passé à la facturation à l'usage le 1er juin 2026. L'OAuth Gemini CLI prend fin le 18 juin. Les forfaits gratuits peuvent rétrécir du jour au lendemain — gardez toujours une clé API de secours prête.
Fragmentation réseau : Gemini CLI et Codex CLI nécessitent un accès proxy fiable depuis la Chine. SiliconFlow, Bailian et Zhipu se connectent directement — une configuration globale unique fonctionne rarement pour toutes les régions.
Commandes gouffre à tokens : Claude Code et Codex /init scannent des dépôts entiers en une seule passe, consommant des centaines de milliers de tokens. Sur des quotas gratuits, évitez ces commandes.
Le vrai coût d'un forfait gratuit n'est pas 0 $ — c'est la vitesse à laquelle vous cartographiez les limites de quota. Un jour d'avance sur la foule vous offre un mois supplémentaire d'inférence gratuite.
Le tableau ci-dessous synthétise les politiques gratuites publiques au 9 juin 2026. Les quotas suivent les dernières annonces de chaque fournisseur. Les lignes marquées d'un avertissement portent un risque de changement récent.
| Outil / Plateforme | Quota gratuit | Compte payant requis | Accès direct Chine | Meilleur levier gratuit |
|---|---|---|---|---|
| Gemini CLI (OAuth) | 1 000 req/jour, 60 RPM | Non | Proxy requis | Attention : migration Antigravity 18 juin |
| Gemini API (AI Studio) | Flash 1 500 req/jour | Non | Proxy requis | Pro 100 req/jour |
| Codex CLI | OAuth ChatGPT gratuit (limité) | Non | Proxy requis | Repli API Chine possible |
| OpenCode | Outil gratuit, API payante | Non | Avec API Chine | 146K stars, 75+ fournisseurs |
| OpenClaw | Outil gratuit, multi-fournisseur | Non | Avec API Chine | Réutilise OAuth Gemini |
| GitHub Copilot Free | 2 000 complétions + 50 premium/mois | Non | Oui | Usage léger à coût zéro |
| Copilot Student | Pro complet (300 premium/mois) | Vérification étudiant | Oui | Valeur 10 $/mois |
| Cursor Hobby | 2 000 Tab + 50 premium lents/mois | Non | Oui | Expérience VS Code complète |
| SiliconFlow | 20M tokens (permanent) | Non | Oui | DeepSeek / Qwen / GLM-5 |
| Alibaba Bailian | 70M tokens (durée limitée) | Non | Oui | 70+ modèles couverts |
| Zhipu AI | 20M tokens (permanent) | Non | Oui | GLM-5 stable |
| Groq | 14 400 req/jour | Non | Proxy requis | Llama / Mixtral rapides |
| Votre réseau | Stack recommandée | Coût mensuel |
|---|---|---|
| Accès proxy stable | Gemini CLI OAuth + Cursor Hobby | 0 $ |
| Chine uniquement, sans proxy | API SiliconFlow + OpenCode + Copilot Free | 0 $ |
| Étudiant | Copilot Student + Cursor Pro étudiant + API Bailian | 0 $ |
| Daemon Agent 24 h/24 | OpenClaw + API Chine + Mac cloud loué | Location Mac |
Compte à rebours du 18 juin : l'accès OAuth gratuit de Gemini CLI s'arrête le 18 juin 2026. Si vous comptez sur 1 000 requêtes gratuites par jour, effectuez la connexion OAuth ce week-end, exportez votre configuration habituelle et inscrivez Antigravity CLI comme solution de repli avant la date limite.
Ce runbook transforme le tableau ci-dessus en un workflow personnel reproductible. Que vous disposiez ou non d'un accès proxy, suivre les six étapes construit un environnement de codage IA à coût zéro en moins de 30 minutes.
Inscrivez le trio API Chine : SiliconFlow (cloud.siliconflow.cn), Alibaba Bailian (dashscope.console.aliyun.com), Zhipu AI (bigmodel.cn) — les crédits combinés à l'inscription dépassent 110M tokens, suffisants pour six mois de développement solo.
Installez OpenCode comme shell unifié : curl -fsSL https://opencode.ai/install | bash, puis /connect à SiliconFlow ou une clé Gemini API — un seul TUI pour basculer entre 75+ modèles.
Ajoutez Gemini CLI si vous avez un proxy : npm install -g @google/gemini-cli, connexion OAuth, /model gemini-2.5-flash pour les tâches courantes, Pro pour les refactors complexes. Terminez avant le 18 juin.
Configurez le repli Chine de Codex CLI : éditez ~/.codex/config.toml, pointez openai_base_url vers SiliconFlow, sélectionnez deepseek-ai/DeepSeek-V3, désactivez web_search pour éviter les timeouts en Chine.
Activez les forfaits IDE gratuits : GitHub → Settings → Copilot → Activer Copilot Free ; téléchargez Cursor Hobby sur cursor.com — combinés, vous obtenez 4 000 complétions Tab + 100 requêtes premium par mois.
Empilez la vérification étudiante pour Copilot Pro : rendez-vous sur github.com/settings/education/benefits avec un e-mail .edu — Copilot Student équivaut à Pro (300 requêtes premium/mois). cursor.com/students offre un an de Cursor Pro gratuit.
openai_base_url = "https://api.siliconflow.cn/v1" model = "deepseek-ai/DeepSeek-V3" sandbox_mode = "workspace-write" web_search = "disabled" approval_policy = "on-request"
export ANTHROPIC_BASE_URL="https://api.siliconflow.cn/v1" export ANTHROPIC_API_KEY="sk-xxxx" claude --model claude-sonnet-4-6
Gemini CLI offre actuellement le quota CLI gratuit officiel le plus généreux : la connexion OAuth débloque 1 000 requêtes par jour à 60 RPM avec un contexte d'1M tokens. Installez via npm install -g @google/gemini-cli, choisissez Sign in with Google au premier lancement. Utilisez /stats model pour suivre la consommation quotidienne et /model pour basculer entre Flash et Pro. Google interdit explicitement de router les tokens OAuth via des proxies tiers — une violation des CGU risque la suspension du compte.
Codex CLI est l'Agent terminal officiel d'OpenAI en Rust, avec plus de 83K stars GitHub et un sandboxing au niveau noyau. Les comptes ChatGPT gratuits peuvent s'authentifier via OAuth pour une fenêtre limitée ; les utilisateurs basés en Chine obtiennent un chemin plus stable en pointant vers l'API SiliconFlow avec le config.toml ci-dessus. OpenCode (146K stars) et OpenClaw sont tous deux open source et gratuits — le premier excelle dans le changement multi-modèles en TUI, le second réutilise l'OAuth Gemini CLI via openclaw models auth login --provider google-gemini-cli.
| Plateforme | Crédit inscription | Endpoint API | Modèles représentatifs |
|---|---|---|---|
| SiliconFlow | 20M tokens (permanent) | api.siliconflow.cn/v1 | DeepSeek-V3, Qwen3.5, GLM-5 |
| Alibaba Bailian | 70M tokens (durée limitée) | dashscope.aliyuncs.com/compatible-mode/v1 | Qwen3.5-Max, DeepSeek-V3 |
| Zhipu AI | 20M tokens (permanent) | open.bigmodel.cn/api/paas/v4 | GLM-5, GLM-4.7-Flash |
| Infini-AI | Large pool de tokens gratuit | cloud.infini-ai.com | API GenStudio |
Cursor Hobby fournit 2 000 complétions Tab et 50 requêtes premium lentes par mois sans carte bancaire — compatibilité complète avec le plugin VS Code incluse. GitHub Copilot Free ajoute 2 000 complétions plus 50 requêtes premium ; la vérification étudiante débloque le Pro complet. Suivez l'usage sur app.cursor.sh/account/usage et GitHub Settings → Copilot.
Tactiques d'économie de tokens : routez les tâches courantes via Gemini 2.5 Flash-Lite (1 500 req/jour), n'escaladez vers Pro que pour les problèmes difficiles. Configurez des alertes à 80 % de quota dans les consoles SiliconFlow et Bailian. Lancez Ollama localement avec qwen3:8b et connectez OpenCode ou OpenClaw pour une inférence locale effectivement illimitée.
Pour rédiger des mémos internes ou des documents d'architecture, citez ces points de données croisés issus de la documentation publique des fournisseurs au 9 juin 2026 :
Les APIs gratuites et les quotas OAuth résolvent le coût d'inférence des modèles, mais ils ne remplacent pas la supervision des processus, l'uptime capot fermé, les limites Keychain ou les runs Agent nocturnes. Beaucoup de développeurs exécutent OpenClaw ou Claude Code la nuit sur un portable — fermer le capot suspend le processus. Les configurations VPS Linux butent régulièrement sur l'absence de Metal ou des dépendances Xcode. Partager un environnement local entre plusieurs CLI signifie des conflits de configuration globale, aucune isolation de clés API, et un Agent débridé qui vide un quota gratuit entier en une nuit.
Comme dans notre classement des outils CLI OpenRouter et notre guide de migration Gemini CLI : les tokens peuvent être gratuits, mais l'uptime de l'hôte est un contrat OpEx. Pour les équipes ayant besoin de daemons Agent 24 h/24 aux côtés de CI/CD iOS, la location cloud Mac Mini M4 VpsMesh regroupe la fiabilité launchd, l'accès SSH et une facturation mensuelle prévisible dans un hôte de production unique. Consultez les tarifs location Mac Mini M4, la documentation de déploiement dans le centre d'aide, ou commandez un Mac cloud directement.
Oui. Connectez-vous avec un compte Google standard via OAuth pour 1 000 requêtes gratuites par jour à 60 RPM — sans carte bancaire. Notez que le parcours OAuth gratuit migre vers Antigravity CLI le 18 juin 2026 ; effectuez la connexion avant la date limite. Les détails de migration figurent dans notre analyse du changement de politique Gemini CLI.
Utilisez SiliconFlow (20M tokens à l'inscription), Alibaba Bailian (70M tokens) et Zhipu AI (20M tokens) avec OpenCode ou Codex CLI — sans proxy. Ajoutez Cursor Hobby et GitHub Copilot Free au niveau IDE. Pour l'hébergement Agent 24 h/24, louez un nœud cloud Mac Mini M4.
Rendez-vous sur github.com/settings/education/benefits, vérifiez votre statut avec un e-mail .edu ou une carte étudiante via GitHub Education, et Copilot Student (équivalent Pro, valeur 10 $/mois) s'active automatiquement. Cursor Pro étudiant est sur cursor.com/students. Pour commander un Mac cloud, consultez la page commander.
Pour un usage léger, oui. Cursor Hobby offre 2 000 complétions Tab et 50 requêtes premium lentes par mois — suffisant pour évaluer le produit. Un développement intensif justifie Pro (20 $/mois) ou le programme étudiant. Consultez l'usage sur app.cursor.sh/account/usage. Plus de comparaisons CLI dans notre guide classement OpenRouter.