OpenAI

GPT-5.5 Pro

GPT-5.5 Pro est un LLM propriétaire d’OpenAI, sorti le 23 avril 2026, positionné sur le segment premium. Le modèle se distingue surtout par une fenêtre de contexte de 1 050 000 tokens, soit environ 1,1 M, et par des résultats de premier plan sur plusieurs évaluations exigeantes en…

À sa sortie, GPT-5.5 Pro figurait dans le top 5% des LLM de sa génération sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat. Sa base de connaissances s’arrête au 2025-12-01 et ses poids ne sont pas ouverts.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	OpenAI
Licence	Proprietary (poids non ouverts)
Date de sortie	23 avril 2026
Connaissances jusqu'à	2025-12-01
Multimodal	oui
Fenêtre de contexte	1 050 000 tokens (≈ 1,1 M)
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Epoch: OTIS Mock AIME 2024-2025	100,0 %	1ᵉ / 111	epoch	✅ Mesuré
Epoch: GPQA diamond	93,9 %	4ᵉ / 132	epoch	✅ Mesuré
Epoch: FrontierMath-Tiers-1-3-v2-Private	87,7 %	1ᵉ / 31	epoch	✅ Mesuré
Epoch: FrontierMath-Tier-4-v2-Private	78,0 %	2ᵉ / 32	epoch	✅ Mesuré
Epoch: SimpleQA Verified	64,5 %	8ᵉ / 52	epoch	✅ Mesuré
Epoch: Chess Puzzles	64,0 %	1ᵉ / 43	epoch	✅ Mesuré
Epoch: FrontierMath-2025-02-28-Private	52,4 %	1ᵉ / 69	epoch	✅ Mesuré
Epoch: FrontierMath-Tier-4-2025-07-01-Private	39,6 %	2ᵉ / 55	epoch	✅ Mesuré
PinchBench : agentique (OpenClaw, 147 tâches)	21,4 %	50ᵉ / 52	pinchbench	✅ Mesuré
BrowseComp	90,1 %	1ᵉ / 51	llm-stats	Auto-déclaré
GDPval-MM	82,3 %	2ᵉ / 3	llm-stats	Auto-déclaré
Humanity's Last Exam	57,2 %	5ᵉ / 86	llm-stats	Auto-déclaré
FrontierMath	39,6 %	3ᵉ / 13	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: OTIS Mock AIME 2024-2025

GPT-5.5100 %

▶ GPT-5.5 Pro100 %

Claude Fable 5100 %

Epoch: GPQA diamond

GPT-5.4 Pro95 %

Gemini 3.1 Pro Preview94 %

▶ GPT-5.5 Pro94 %

Qwen3.7 Max92 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
OpenAI	30 $	180 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 1439 % au-dessus de la moyenne des LLM similaires, et 6,2 fois plus cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût par exécution agentique — PinchBench (147 tâches)	238,55 $
Durée d'exécution — PinchBench	7 h 54 min
Indice valeur/coût — PinchBench	0,24

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Entraînement & empreinte

Indicateur	Valeur
Pays	United States of America

Notre analyse

Forces. GPT-5.5 Pro affiche un profil très fort sur les tâches de raisonnement formel. Il atteint le meilleur rang sur OTIS Mock AIME 2024-2025, qui évalue les olympiades de mathématiques de niveau lycée, ainsi que sur FrontierMath-Tiers-1-3-v2-Private, centré sur des mathématiques de recherche très difficiles. Il reste aussi dans le haut du classement sur FrontierMath-Tier-4-v2-Private et GPQA diamond, ce qui indique une solidité particulière sur les problèmes scientifiques complexes. Le modèle se distingue également sur Chess Puzzles, où il occupe la première place de son panel, un signal cohérent avec ses performances en résolution structurée. La très grande fenêtre de contexte renforce son intérêt pour l’analyse de longs corpus, de dossiers techniques ou de suites de documents volumineuses.

Limites et points d'attention. GPT-5.5 Pro est un modèle fermé, avec des poids non ouverts, ce qui limite l’audit indépendant, l’hébergement autonome et l’adaptation fine hors cadre propriétaire. Son score sur SimpleQA Verified reste nettement moins dominant que ses résultats en mathématiques et en sciences, ce qui invite à distinguer raisonnement avancé et fiabilité factuelle vérifiable. Le coût constitue le principal frein économique : le tarif d’entrée et de sortie le place très au-dessus de la moyenne des LLM similaires, avec un prix environ 6,2 fois supérieur à celui des modèles frontière. Ce positionnement vise surtout les usages où la performance de raisonnement et le très long contexte justifient un budget élevé.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0 · PinchBench (pinchbench.com).

GPT-5.5 Pro

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Entraînement & empreinte

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast