GPT-5 nano
GPT-5 nano est un LLM propriétaire d’OpenAI, sorti le 7 août 2025, avec des poids non ouverts et des connaissances arrêtées au 30 mai 2024. Son positionnement est celui d’un modèle très économique, nettement moins cher que la moyenne des LLM similaires et très en retrait des tarifs des…
GPT-5 nano est un LLM propriétaire d’OpenAI, sorti le 7 août 2025, avec des poids non ouverts et des connaissances arrêtées au 30 mai 2024. Son positionnement est celui d’un modèle très économique, nettement moins cher que la moyenne des LLM similaires et très en retrait des tarifs des modèles frontière.
Le modèle se distingue surtout par une fenêtre de contexte de 400 000 tokens et un profil orienté volume: coût d’entrée très bas, coût de sortie contenu, et couverture par 7 sources concordantes. À sa sortie, il se situait dans le top 24% de sa génération sur Epoch: GPQA diamond, ce qui le place dans le haut du panier de son époque sur ce test.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | OpenAI |
| Licence | Proprietary (poids non ouverts) |
| Date de sortie | 7 août 2025 |
| Connaissances jusqu'à | 2024-05-30 |
| Multimodal | oui |
| Fenêtre de contexte | 400 000 tokens |
| Modalités (entrée → sortie) | text,image → text |
Indices de synthèse
| Indice | Valeur | Rang (LLM) |
|---|---|---|
| Intelligence Index | 19.9 | 100ᵉ / 136 |
| Math Index | 83.7 | 15ᵉ / 55 |
Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : General Knowledge (Baseline) | 100,0 % | 1ᵉ / 250 | benchable | ✅ Mesuré |
| Benchable : Hallucinations (Baseline) | 100,0 % | 1ᵉ / 229 | benchable | ✅ Mesuré |
| Benchable : Email Classification (Baseline) | 99,0 % | 24ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : Ethics (Baseline) | 98,0 % | 161ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Reasoning (Baseline) | 96,0 % | 39ᵉ / 239 | benchable | ✅ Mesuré |
| Epoch: MATH level 5 | 95,2 % | 11ᵉ / 84 | epoch | ✅ Mesuré |
| Benchable : Mathematics (Baseline) | 94,0 % | 42ᵉ / 217 | benchable | ✅ Mesuré |
| Benchable : Coding (Baseline) | 93,0 % | 58ᵉ / 248 | benchable | ✅ Mesuré |
| Epoch: OTIS Mock AIME 2024-2025 | 81,1 % | 43ᵉ / 111 | epoch | ✅ Mesuré |
| Epoch: GPQA diamond | 69,4 % | 58ᵉ / 132 | epoch | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 69,0 % | 98ᵉ / 252 | benchable | ✅ Mesuré |
| LiveBench: Mathematics | 68,4 % | 57ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Coding | 62,4 % | 68ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: IF | 55,7 % | 42ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Global average | 48,6 % | 62ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Language | 46,8 % | 71ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Data Analysis | 43,4 % | 69ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Reasoning | 40,3 % | 65ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Agentic Coding | 23,3 % | 62ᵉ / 76 | livebench | ✅ Mesuré |
| Epoch: FrontierMath-Tiers-1-3-v2-Private | 20,0 % | 29ᵉ / 31 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-2025-02-28-Public | 20,0 % | 27ᵉ / 64 | epoch | ✅ Mesuré |
| Epoch: SimpleQA Verified | 12,2 % | 48ᵉ / 52 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-2025-02-28-Private | 8,3 % | 41ᵉ / 69 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-Tier-4-v2-Private | 2,4 % | 27ᵉ / 32 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-Tier-4-2025-07-01-Private | 2,1 % | 39ᵉ / 55 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-Tier-4-2025-07-01-Public | 0,0 % | 3ᵉ / 36 | epoch | ✅ Mesuré |
| AIME 2025 | 85,2 % | 55ᵉ / 108 | llm-stats | Auto-déclaré |
| HMMT 2025 | 75,6 % | 26ᵉ / 33 | llm-stats | Auto-déclaré |
| GPQA | 71,2 % | 107ᵉ / 213 | llm-stats | Auto-déclaré |
| FrontierMath | 9,6 % | 10ᵉ / 13 | llm-stats | Auto-déclaré |
| Humanity's Last Exam | 8,7 % | 78ᵉ / 86 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Intelligence Index
Math Index
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1337 | 190ᵉ |
| Arena Vision | 1146 | 85ᵉ |
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Azure | 0,05 $ | 0,4 $ | 0,01 $ |
| artificialanalysis | 0,05 $ | 0,4 $ | 0,005 $ |
| artificialanalysis | 0,05 $ | 0,4 $ | 0,0075 $ |
| artificialanalysis | 0,05 $ | 0,4 $ | 0,01 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 97 % en dessous de la moyenne des LLM similaires, et 96,7 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0,03 $ |
| Latence moyenne par benchmark — Benchable | 8 min 09 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Entraînement & empreinte
| Indicateur | Valeur |
|---|---|
| Pays | United States of America |
Notre analyse
Forces. GPT-5 nano affiche ses meilleurs signaux sur les tâches de connaissances générales et de maîtrise des hallucinations dans Benchable, où il apparaît dans le top 10. Il est aussi solide en classification d’e-mails et en raisonnement Benchable, avec des résultats élevés, même si le classement n’est pas aussi dominant. Son Math Index est nettement meilleur que son Intelligence Index, et Epoch: MATH level 5 le place parmi les modèles performants sur les problèmes mathématiques exigeants. Sa grande fenêtre de contexte renforce son intérêt pour traiter de longs documents ou de grands historiques, tandis que son prix, 97% sous la moyenne des LLM similaires et environ 96.7 fois inférieur aux modèles frontière, en fait un candidat naturel pour les traitements massifs.
Limites et points d'attention. L’Intelligence Index situe GPT-5 nano bas dans le classement global, ce qui tempère ses très bons résultats ponctuels. Le benchmark Ethics est élevé en score brut mais très moyen en rang, et les classements Arena text et Arena vision restent loin des meilleurs modèles évalués. La licence propriétaire limite l’audit indépendant des poids. La coupure de connaissances au 30 mai 2024 impose aussi une mise à jour externe pour les faits récents. Usage le plus cohérent: tâches nombreuses à faible coût, classification, connaissances générales contrôlées, raisonnement simple à intermédiaire et mathématiques quand le budget prime sur la performance globale maximale.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0 · Benchable.ai (benchable.ai).