OpenAI

OpenAI: GPT-5.4 Pro

OpenAI: GPT-5.4 Pro est un LLM d’OpenAI, sorti le 5 mars 2026 aux États-Unis, avec un positionnement premium. Sa caractéristique la plus visible est une fenêtre de contexte de 1 050 000 tokens, soit environ 1,1 M, qui le place dans la catégorie des modèles conçus pour traiter de très…

À sa sortie, il se situe dans le top 1% des LLM de sa génération sur Epoch: GPQA diamond, un benchmark de questions scientifiques niveau doctorat. Son profil ressort surtout sur les tâches scientifiques, mathématiques et de raisonnement structuré, avec une couverture confirmée par 2 sources de données concordantes.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	OpenAI
Date de sortie	5 mars 2026
Multimodal	oui
Fenêtre de contexte	1 050 000 tokens (≈ 1,1 M)
Modalités (entrée → sortie)	text,image,file → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Epoch: GPQA diamond	94,6 %	1ᵉ / 132	epoch	✅ Mesuré
Epoch: FrontierMath-Tiers-1-3-v2-Private	82,5 %	4ᵉ / 31	epoch	✅ Mesuré
Epoch: Chess Puzzles	58,6 %	2ᵉ / 43	epoch	✅ Mesuré
Epoch: FrontierMath-Tier-4-v2-Private	58,5 %	5ᵉ / 32	epoch	✅ Mesuré
Epoch: FrontierMath-2025-02-28-Private	50,0 %	3ᵉ / 69	epoch	✅ Mesuré
Epoch: SimpleQA Verified	47,8 %	21ᵉ / 52	epoch	✅ Mesuré
Epoch: FrontierMath-Tier-4-2025-07-01-Private	37,5 %	3ᵉ / 55	epoch	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: GPQA diamond

▶ GPT-5.4 Pro95 %

Gemini 3.1 Pro Preview94 %

Qwen3.7 Max92 %

Epoch: FrontierMath-Tiers-1-3-v2-Private

GPT-5.5 Pro88 %

Claude Fable 587 %

▶ GPT-5.4 Pro82 %

Qwen3.7 Max65 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
OpenAI	30 $	180 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 1439 % au-dessus de la moyenne des LLM similaires, et 6,2 fois plus cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Entraînement & empreinte

Indicateur	Valeur
Pays	United States of America

Notre analyse

Forces. OpenAI: GPT-5.4 Pro affiche ses meilleurs signaux sur GPQA diamond, où il occupe la première place du panel mesuré, ce qui indique un très haut niveau sur les questions scientifiques de niveau doctorat. Il figure aussi dans le top 10 sur plusieurs versions de FrontierMath, un ensemble de benchmarks centré sur des mathématiques de recherche très difficiles. Sa bonne position sur Chess Puzzles renforce ce profil de modèle solide sur les problèmes formalisés, où la recherche de solution et le raisonnement étape par étape sont déterminants. La très grande fenêtre de contexte ajoute un atout opérationnel pour les analyses longues, les corpus volumineux et les tâches nécessitant de conserver beaucoup d’informations en une seule requête.

Limites et points d'attention. Le modèle est très coûteux: 30 $ par million de tokens en entrée et 180 $ par million de tokens en sortie. Son tarif est indiqué comme 1439% au-dessus de la moyenne des LLM similaires et environ 6,2 fois plus cher que les modèles frontière, ce qui limite son intérêt économique aux cas où ses performances spécialisées justifient la dépense. Son résultat sur SimpleQA Verified est nettement moins dominant que sur les benchmarks scientifiques et mathématiques, avec une position de milieu de tableau sur les questions factuelles vérifiables. Ce profil convient surtout aux usages où le raisonnement scientifique ou mathématique difficile prime sur le coût unitaire et sur la performance factuelle généraliste.

Sources des données : OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.

OpenAI: GPT-5.4 Pro

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Entraînement & empreinte

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast