OpenAI: GPT-5.4 Pro
OpenAI: GPT-5.4 Pro est un LLM d’OpenAI, sorti le 5 mars 2026 aux États-Unis, avec un positionnement premium. Sa caractéristique la plus visible est une fenêtre de contexte de 1 050 000 tokens, soit environ 1,1 M, qui le place dans la catégorie des modèles conçus pour traiter de très…
OpenAI: GPT-5.4 Pro est un LLM d’OpenAI, sorti le 5 mars 2026 aux États-Unis, avec un positionnement premium. Sa caractéristique la plus visible est une fenêtre de contexte de 1 050 000 tokens, soit environ 1,1 M, qui le place dans la catégorie des modèles conçus pour traiter de très grands volumes de texte.
À sa sortie, il se situe dans le top 1% des LLM de sa génération sur Epoch: GPQA diamond, un benchmark de questions scientifiques niveau doctorat. Son profil ressort surtout sur les tâches scientifiques, mathématiques et de raisonnement structuré, avec une couverture confirmée par 2 sources de données concordantes.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | OpenAI |
| Date de sortie | 5 mars 2026 |
| Multimodal | oui |
| Fenêtre de contexte | 1 050 000 tokens (≈ 1,1 M) |
| Modalités (entrée → sortie) | text,image,file → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: GPQA diamond | 94,6 % | 1ᵉ / 132 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-Tiers-1-3-v2-Private | 82,5 % | 4ᵉ / 31 | epoch | ✅ Mesuré |
| Epoch: Chess Puzzles | 58,6 % | 2ᵉ / 43 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-Tier-4-v2-Private | 58,5 % | 5ᵉ / 32 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-2025-02-28-Private | 50,0 % | 3ᵉ / 69 | epoch | ✅ Mesuré |
| Epoch: SimpleQA Verified | 47,8 % | 21ᵉ / 52 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-Tier-4-2025-07-01-Private | 37,5 % | 3ᵉ / 55 | epoch | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Epoch: GPQA diamond
Epoch: FrontierMath-Tiers-1-3-v2-Private
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| OpenAI | 30 $ | 180 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 1439 % au-dessus de la moyenne des LLM similaires, et 6,2 fois plus cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Entraînement & empreinte
| Indicateur | Valeur |
|---|---|
| Pays | United States of America |
Notre analyse
Forces. OpenAI: GPT-5.4 Pro affiche ses meilleurs signaux sur GPQA diamond, où il occupe la première place du panel mesuré, ce qui indique un très haut niveau sur les questions scientifiques de niveau doctorat. Il figure aussi dans le top 10 sur plusieurs versions de FrontierMath, un ensemble de benchmarks centré sur des mathématiques de recherche très difficiles. Sa bonne position sur Chess Puzzles renforce ce profil de modèle solide sur les problèmes formalisés, où la recherche de solution et le raisonnement étape par étape sont déterminants. La très grande fenêtre de contexte ajoute un atout opérationnel pour les analyses longues, les corpus volumineux et les tâches nécessitant de conserver beaucoup d’informations en une seule requête.
Limites et points d'attention. Le modèle est très coûteux: 30 $ par million de tokens en entrée et 180 $ par million de tokens en sortie. Son tarif est indiqué comme 1439% au-dessus de la moyenne des LLM similaires et environ 6,2 fois plus cher que les modèles frontière, ce qui limite son intérêt économique aux cas où ses performances spécialisées justifient la dépense. Son résultat sur SimpleQA Verified est nettement moins dominant que sur les benchmarks scientifiques et mathématiques, avec une position de milieu de tableau sur les questions factuelles vérifiables. Ce profil convient surtout aux usages où le raisonnement scientifique ou mathématique difficile prime sur le coût unitaire et sur la performance factuelle généraliste.
Sources des données : OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.