OpenAI

GPT-3.5 Turbo

GPT-3.5 Turbo est un LLM propriétaire d'OpenAI, sorti le 21 mars 2023. Avec près de trois ans d'ancienneté, il appartient désormais à une génération très ancienne à l'échelle de l'IA : il doit être situé parmi les modèles de sa période, probablement dépassé par les systèmes récents et…

Son intérêt historique tient surtout à son positionnement très économique. Ses prix se placent nettement sous la moyenne des LLM similaires et environ 9,7 fois sous ceux des modèles frontière. Le modèle combine 20 milliards de paramètres, une fenêtre de contexte de 16 385 tokens et des connaissances arrêtées au 30 septembre 2021.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	OpenAI
Licence	Proprietary (poids non ouverts)
Date de sortie	21 mars 2023
Connaissances jusqu'à	2021-09-30
Multimodal	non
Paramètres	20 milliards
Fenêtre de contexte	16 385 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Epoch: GPQA diamond	28,0 %	122ᵉ / 132	epoch	✅ Mesuré
Epoch: MATH level 5	15,9 %	71ᵉ / 84	epoch	✅ Mesuré
DROP	70,2 %	20ᵉ / 29	llm-stats	n.d.
MMLU	69,8 %	81ᵉ / 98	llm-stats	n.d.
HumanEval	68,0 %	57ᵉ / 65	llm-stats	n.d.
MGSM	56,3 %	27ᵉ / 30	llm-stats	n.d.
MATH	43,1 %	62ᵉ / 70	llm-stats	n.d.
GPQA	30,8 %	200ᵉ / 213	llm-stats	n.d.
MathVista	0,0 %	38ᵉ / 38	llm-stats	n.d.
MMMU	0,0 %	61ᵉ / 61	llm-stats	n.d.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: GPQA diamond

GPT-5.4 Pro95 %

Gemini 3.1 Pro Preview94 %

Qwen3.7 Max92 %

Phi 456 %

▶ GPT-3.5 Turbo28 %

Epoch: MATH level 5

GPT-598 %

Claude Sonnet 4.598 %

Qwen3-Max-Instruct97 %

Phi 465 %

▶ GPT-3.5 Turbo16 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
azure	0,5 $	1,5 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 74 % en dessous de la moyenne des LLM similaires, et 9,7 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Entraînement & empreinte

Indicateur	Valeur
Jeu de données	Unspecified unreleased
Pays	United States of America

Notre analyse

Forces. À sa sortie, GPT-3.5 Turbo se distinguait surtout par un compromis coût-volume très agressif pour un modèle OpenAI propriétaire. Sa tarification très inférieure à celle des LLM comparables en faisait un candidat économique pour des usages massifs à faible marge. Sa fenêtre de contexte de 16 385 tokens donnait aussi davantage de latitude que des modèles limités à des échanges courts. Dans sa génération, son principal atout n'était pas la performance scientifique de pointe, mais l'accès à un LLM généraliste bon marché, avec des métadonnées confirmées par trois sources concordantes.

Limites et points d'attention. Les résultats disponibles montrent un modèle aujourd'hui largement dépassé sur les tâches exigeantes. Sur GPQA diamond, qui mesure des questions scientifiques de niveau doctorat, GPT-3.5 Turbo se situe dans le bas du classement. MATH level 5 confirme une faiblesse nette sur le raisonnement mathématique avancé. Sa coupure de connaissances à 2021-09-30 limite aussi sa pertinence sur les sujets récents. Les poids ne sont pas ouverts, ce qui restreint l'audit et l'hébergement indépendant. Aucune donnée vérifiée d'équivalent GPU H100 ni de coût d'entraînement n'est fournie dans les éléments retenus, ce qui empêche de quantifier l'effort d'entraînement.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.

GPT-3.5 Turbo

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Entraînement & empreinte

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast