OpenAI: GPT-5 Pro
OpenAI: GPT-5 Pro est un LLM premium d’OpenAI, sorti le 6 octobre 2025, avec une fenêtre de contexte de 400 000 tokens et des connaissances arrêtées au 30 septembre 2024. À sa sortie, il se situait dans le top 5% des LLM de sa génération sur LiveBench: Global average, parmi les modèles…
OpenAI: GPT-5 Pro est un LLM premium d’OpenAI, sorti le 6 octobre 2025, avec une fenêtre de contexte de 400 000 tokens et des connaissances arrêtées au 30 septembre 2024. À sa sortie, il se situait dans le top 5% des LLM de sa génération sur LiveBench: Global average, parmi les modèles évalués sur la même période.
Son profil combine un très bon niveau en compréhension du langage, un raisonnement solide et un coût nettement supérieur au marché. La fiche met surtout en évidence un modèle haut de gamme, performant dans plusieurs tâches générales, mais dont le positionnement tarifaire impose un usage sélectif.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | OpenAI |
| Date de sortie | 6 octobre 2025 |
| Connaissances jusqu'à | 2024-09-30 |
| Multimodal | oui |
| Fenêtre de contexte | 400 000 tokens |
| Modalités (entrée → sortie) | image,text,file → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| LiveBench: Mathematics | 86,2 % | 18ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Reasoning | 81,7 % | 15ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Language | 80,7 % | 10ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Coding | 72,1 % | 37ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Global average | 70,5 % | 23ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: IF | 64,0 % | 19ᵉ / 76 | livebench | ✅ Mesuré |
| Epoch: FrontierMath-2025-02-28-Public | 60,0 % | 12ᵉ / 64 | epoch | ✅ Mesuré |
| LiveBench: Data Analysis | 57,0 % | 37ᵉ / 76 | livebench | ✅ Mesuré |
| Epoch: FrontierMath-Tiers-1-3-v2-Private | 55,8 % | 16ᵉ / 31 | epoch | ✅ Mesuré |
| LiveBench: Agentic Coding | 51,7 % | 24ᵉ / 76 | livebench | ✅ Mesuré |
| Epoch: FrontierMath-Tier-4-v2-Private | 19,5 % | 18ᵉ / 32 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-Tier-4-2025-07-01-Private | 14,6 % | 13ᵉ / 55 | epoch | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
LiveBench: Mathematics
LiveBench: Reasoning
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| OpenAI | 15 $ | 120 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 670 % au-dessus de la moyenne des LLM similaires, et 3,1 fois plus cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Entraînement & empreinte
| Indicateur | Valeur |
|---|---|
| Pays | United States of America |
Notre analyse
Forces. OpenAI: GPT-5 Pro se distingue d’abord sur LiveBench: Language, où il atteint le top 10, ce qui indique une compréhension du langage parmi les meilleures du panel évalué. Ses résultats en Mathematics et en Reasoning le placent aussi dans le haut du classement, avec un profil cohérent pour les tâches nécessitant calcul, logique et traitement d’instructions complexes. Le suivi d’instructions reste correctement positionné, sans être son point le plus fort. À sa sortie, son classement global dans le top 5% de sa génération en faisait un modèle très compétitif sur les évaluations généralistes disponibles.
Limites et points d’attention. La programmation ressort comme la zone la moins convaincante du profil LiveBench, avec un rang de milieu de tableau plutôt qu’un niveau de référence. Le coût constitue l’autre contrainte majeure: avec un tarif premium, 670% au-dessus de la moyenne des LLM similaires et environ 3,1 fois plus cher que les modèles frontière, son usage se justifie surtout lorsque la qualité linguistique, le raisonnement et la grande fenêtre de contexte priment sur l’optimisation budgétaire. OpenAI: GPT-5 Pro se prête donc aux analyses longues, aux tâches rédactionnelles exigeantes et aux raisonnements structurés, moins aux volumes massifs de génération ou aux usages centrés sur le code.
Sources des données : OpenRouter (openrouter.ai) · LiveBench (livebench.ai) · Epoch AI (epoch.ai), CC-BY-4.0.