OpenAI

gpt-4o-search-preview-2025-03-11

gpt-4o-search-preview-2025-03-11 est un LLM d’OpenAI sorti le 12 mars 2025. Avec environ un an d’ancienneté, il appartient déjà à une génération très datée à l’échelle de l’IA, à comparer surtout aux modèles disponibles au moment de sa sortie plutôt qu’aux systèmes actuels.

Son profil Benchable montre un modèle solide sur plusieurs tâches de base, notamment l’éthique, la culture générale, la classification d’e-mails, les mathématiques et le code. Son prix se situe dans la moyenne du marché, mais reste supérieur à celui des LLM similaires, tout en demeurant nettement inférieur aux modèles frontière.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	OpenAI
Date de sortie	12 mars 2025

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Ethics (Baseline)	99,0 %	114ᵉ / 248	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	96,0 %	175ᵉ / 250	benchable	✅ Mesuré
Benchable : Email Classification (Baseline)	96,0 %	197ᵉ / 254	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	92,0 %	92ᵉ / 217	benchable	✅ Mesuré
Benchable : Coding (Baseline)	89,0 %	118ᵉ / 248	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	0,0 %	229ᵉ / 252	benchable	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Ethics (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

Gemini 2.5 Flash Lite P…100 %

Qwen2.5 72B Instruct100 %

▶ gpt-4o-search-preview-2…99 %

Benchable : General Knowledge (Baseline)

Claude Opus 4100 %

Gemini 2.5 Flash100 %

GPT-5100 %

Phi 497 %

▶ gpt-4o-search-preview-2…96 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
OpenAIAdapter	2,5 $	10 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 28 % au-dessus de la moyenne des LLM similaires, et 1,9 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,15 $
Latence moyenne par benchmark — Benchable	7 min 41 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. gpt-4o-search-preview-2025-03-11 obtient ses résultats les plus convaincants sur Ethics (Baseline), General Knowledge (Baseline) et Email Classification (Baseline), ce qui indique un comportement fiable sur des évaluations de conformité, de connaissances générales et de tri de contenus simples. Mathematics (Baseline) ressort aussi comme un point relativement solide, avec un classement plus favorable que sur plusieurs autres catégories. Coding (Baseline) reste exploitable dans ce référentiel, sans atteindre le haut du tableau. À sa sortie, le modèle s’inscrivait dans une génération déjà compétitive, avec des scores bruts élevés sur plusieurs tests de base, mais sans domination nette dans les classements.

Limites et points d'attention. Le signal le plus faible concerne Instruction Following (Baseline), où le score nul et le rang très bas indiquent une difficulté majeure à respecter précisément les consignes dans ce benchmark. Son ancienneté pèse fortement : ses performances sont aujourd’hui largement dépassées et ce type de préversion est souvent retiré du catalogue de l’éditeur. Le prix n’est pas particulièrement agressif, car il dépasse la moyenne des LLM similaires, même s’il reste environ 1,9 fois moins cher que les modèles frontière. Les données disponibles reposent sur 2 sources concordantes, mais aucun chiffre vérifié sur l’entraînement, le coût de calcul ou l’équivalent GPU H100 n’est fourni.

Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).

gpt-4o-search-preview-2025-03-11

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast