GPT-3.5 Turbo
GPT-3.5 Turbo est un LLM propriétaire d'OpenAI, sorti le 21 mars 2023. Avec près de trois ans d'ancienneté, il appartient désormais à une génération très ancienne à l'échelle de l'IA : il doit être situé parmi les modèles de sa période, probablement dépassé par les systèmes récents et…
GPT-3.5 Turbo est un LLM propriétaire d'OpenAI, sorti le 21 mars 2023. Avec près de trois ans d'ancienneté, il appartient désormais à une génération très ancienne à l'échelle de l'IA : il doit être situé parmi les modèles de sa période, probablement dépassé par les systèmes récents et souvent retiré du catalogue de son éditeur.
Son intérêt historique tient surtout à son positionnement très économique. Ses prix se placent nettement sous la moyenne des LLM similaires et environ 9,7 fois sous ceux des modèles frontière. Le modèle combine 20 milliards de paramètres, une fenêtre de contexte de 16 385 tokens et des connaissances arrêtées au 30 septembre 2021.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | OpenAI |
| Licence | Proprietary (poids non ouverts) |
| Date de sortie | 21 mars 2023 |
| Connaissances jusqu'à | 2021-09-30 |
| Multimodal | non |
| Paramètres | 20 milliards |
| Fenêtre de contexte | 16 385 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: GPQA diamond | 28,0 % | 122ᵉ / 132 | epoch | ✅ Mesuré |
| Epoch: MATH level 5 | 15,9 % | 71ᵉ / 84 | epoch | ✅ Mesuré |
| DROP | 70,2 % | 20ᵉ / 29 | llm-stats | n.d. |
| MMLU | 69,8 % | 81ᵉ / 98 | llm-stats | n.d. |
| HumanEval | 68,0 % | 57ᵉ / 65 | llm-stats | n.d. |
| MGSM | 56,3 % | 27ᵉ / 30 | llm-stats | n.d. |
| MATH | 43,1 % | 62ᵉ / 70 | llm-stats | n.d. |
| GPQA | 30,8 % | 200ᵉ / 213 | llm-stats | n.d. |
| MathVista | 0,0 % | 38ᵉ / 38 | llm-stats | n.d. |
| MMMU | 0,0 % | 61ᵉ / 61 | llm-stats | n.d. |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Epoch: GPQA diamond
Epoch: MATH level 5
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| azure | 0,5 $ | 1,5 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 74 % en dessous de la moyenne des LLM similaires, et 9,7 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Entraînement & empreinte
| Indicateur | Valeur |
|---|---|
| Jeu de données | Unspecified unreleased |
| Pays | United States of America |
Notre analyse
Forces. À sa sortie, GPT-3.5 Turbo se distinguait surtout par un compromis coût-volume très agressif pour un modèle OpenAI propriétaire. Sa tarification très inférieure à celle des LLM comparables en faisait un candidat économique pour des usages massifs à faible marge. Sa fenêtre de contexte de 16 385 tokens donnait aussi davantage de latitude que des modèles limités à des échanges courts. Dans sa génération, son principal atout n'était pas la performance scientifique de pointe, mais l'accès à un LLM généraliste bon marché, avec des métadonnées confirmées par trois sources concordantes.
Limites et points d'attention. Les résultats disponibles montrent un modèle aujourd'hui largement dépassé sur les tâches exigeantes. Sur GPQA diamond, qui mesure des questions scientifiques de niveau doctorat, GPT-3.5 Turbo se situe dans le bas du classement. MATH level 5 confirme une faiblesse nette sur le raisonnement mathématique avancé. Sa coupure de connaissances à 2021-09-30 limite aussi sa pertinence sur les sujets récents. Les poids ne sont pas ouverts, ce qui restreint l'audit et l'hébergement indépendant. Aucune donnée vérifiée d'équivalent GPU H100 ni de coût d'entraînement n'est fournie dans les éléments retenus, ce qui empêche de quantifier l'effort d'entraînement.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.