OpenAI: GPT-5.4 Pro

OpenAI: GPT-5.4 Pro est un LLM d’OpenAI, sorti le 5 mars 2026 aux États-Unis, avec un positionnement premium. Sa caractéristique la plus visible est une fenêtre de contexte de 1 050 000 tokens, soit environ 1,1 M, qui le place dans la catégorie des modèles conçus pour traiter de très…

OpenAI: GPT-5.4 Pro est un LLM d’OpenAI, sorti le 5 mars 2026 aux États-Unis, avec un positionnement premium. Sa caractéristique la plus visible est une fenêtre de contexte de 1 050 000 tokens, soit environ 1,1 M, qui le place dans la catégorie des modèles conçus pour traiter de très grands volumes de texte.

À sa sortie, il se situe dans le top 1% des LLM de sa génération sur Epoch: GPQA diamond, un benchmark de questions scientifiques niveau doctorat. Son profil ressort surtout sur les tâches scientifiques, mathématiques et de raisonnement structuré, avec une couverture confirmée par 2 sources de données concordantes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurOpenAI
Date de sortie5 mars 2026
Multimodaloui
Fenêtre de contexte1 050 000 tokens (≈ 1,1 M)
Modalités (entrée → sortie)text,image,file → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: GPQA diamond94,6 %1ᵉ / 132epoch✅ Mesuré
Epoch: FrontierMath-Tiers-1-3-v2-Private82,5 %4ᵉ / 31epoch✅ Mesuré
Epoch: Chess Puzzles58,6 %2ᵉ / 43epoch✅ Mesuré
Epoch: FrontierMath-Tier-4-v2-Private58,5 %5ᵉ / 32epoch✅ Mesuré
Epoch: FrontierMath-2025-02-28-Private50,0 %3ᵉ / 69epoch✅ Mesuré
Epoch: SimpleQA Verified47,8 %21ᵉ / 52epoch✅ Mesuré
Epoch: FrontierMath-Tier-4-2025-07-01-Private37,5 %3ᵉ / 55epoch✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: GPQA diamond

▶ GPT-5.4 Pro95 %
Qwen3.7 Max92 %

Epoch: FrontierMath-Tiers-1-3-v2-Private

GPT-5.5 Pro88 %
▶ GPT-5.4 Pro82 %
Qwen3.7 Max65 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
OpenAI30 $180 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 1439 % au-dessus de la moyenne des LLM similaires, et 6,2 fois plus cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Entraînement & empreinte

IndicateurValeur
PaysUnited States of America

Notre analyse

Forces. OpenAI: GPT-5.4 Pro affiche ses meilleurs signaux sur GPQA diamond, où il occupe la première place du panel mesuré, ce qui indique un très haut niveau sur les questions scientifiques de niveau doctorat. Il figure aussi dans le top 10 sur plusieurs versions de FrontierMath, un ensemble de benchmarks centré sur des mathématiques de recherche très difficiles. Sa bonne position sur Chess Puzzles renforce ce profil de modèle solide sur les problèmes formalisés, où la recherche de solution et le raisonnement étape par étape sont déterminants. La très grande fenêtre de contexte ajoute un atout opérationnel pour les analyses longues, les corpus volumineux et les tâches nécessitant de conserver beaucoup d’informations en une seule requête.

Limites et points d'attention. Le modèle est très coûteux: 30 $ par million de tokens en entrée et 180 $ par million de tokens en sortie. Son tarif est indiqué comme 1439% au-dessus de la moyenne des LLM similaires et environ 6,2 fois plus cher que les modèles frontière, ce qui limite son intérêt économique aux cas où ses performances spécialisées justifient la dépense. Son résultat sur SimpleQA Verified est nettement moins dominant que sur les benchmarks scientifiques et mathématiques, avec une position de milieu de tableau sur les questions factuelles vérifiables. Ce profil convient surtout aux usages où le raisonnement scientifique ou mathématique difficile prime sur le coût unitaire et sur la performance factuelle généraliste.


Sources des données : OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.