OpenAI: GPT-3.5 Turbo Instruct

OpenAI: GPT-3.5 Turbo Instruct est un LLM d’OpenAI sorti le 28 septembre 2023, conçu comme un modèle instruct économique de la génération GPT-3.5. Avec 20 milliards de paramètres et une fenêtre de contexte de 4 095 tokens, il appartient à une époque où les modèles d’instruction…

OpenAI: GPT-3.5 Turbo Instruct est un LLM d’OpenAI sorti le 28 septembre 2023, conçu comme un modèle instruct économique de la génération GPT-3.5. Avec 20 milliards de paramètres et une fenêtre de contexte de 4 095 tokens, il appartient à une époque où les modèles d’instruction spécialisés restaient souvent plus compacts que les modèles conversationnels haut de gamme.

Son ancienneté, environ trois ans, est très longue à l’échelle de l’IA. Ses connaissances s’arrêtent au 30 septembre 2021, ce qui le situe nettement avant les modèles récents. Son principal intérêt historique tient à son positionnement: un modèle OpenAI peu coûteux, 23% sous la moyenne des LLM similaires et environ 3,2 fois moins cher que les modèles frontière.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurOpenAI
Date de sortie28 septembre 2023
Connaissances jusqu'à2021-09-30
Multimodalnon
Paramètres20 milliards
Fenêtre de contexte4 095 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Ethics (Baseline)97,0 %195ᵉ / 248benchable✅ Mesuré
Benchable : General Knowledge (Baseline)93,5 %193ᵉ / 250benchable✅ Mesuré
Benchable : Coding (Baseline)71,0 %198ᵉ / 248benchable✅ Mesuré
Benchable : Hallucinations (Baseline)60,0 %204ᵉ / 229benchable✅ Mesuré
Benchable : Instruction Following (Baseline)38,0 %197ᵉ / 252benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Ethics (Baseline)

Qwen2.5 72B Instruct100 %
▶ GPT-3.5 Turbo I…97 %

Benchable : General Knowledge (Baseline)

GPT-5100 %
Phi 497 %
▶ GPT-3.5 Turbo I…94 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
OpenAI1,5 $2 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 23 % en dessous de la moyenne des LLM similaires, et 3,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,05 $
Latence moyenne par benchmark — Benchable2 min 36 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Entraînement & empreinte

IndicateurValeur
Jeu de donnéesUnspecified unreleased
PaysUnited States of America

Notre analyse

Forces. OpenAI: GPT-3.5 Turbo Instruct conserve ses meilleurs signaux sur Ethics (Baseline) et General Knowledge (Baseline), deux benchmarks où ses scores absolus restent élevés malgré un classement relatif modeste. À sa sortie, ce profil correspondait à un LLM instruct économique capable de traiter des tâches générales et des requêtes de connaissances avec un coût contenu. Le tarif d’entrée et de sortie le plaçait dans une logique d’usage à volume, avec un prix inférieur à la moyenne des modèles comparables. Sa taille de 20 milliards de paramètres en faisait aussi un modèle plus léger que les très grands systèmes, tout en restant rattaché à la famille GPT-3.5 d’OpenAI.

Limites et points d'attention. Le modèle est aujourd’hui largement dépassé par les générations récentes. Son rang Benchable reste bas sur l’ensemble des catégories fournies, y compris Coding (Baseline), Hallucinations (Baseline) et surtout Instruction Following (Baseline), ce qui limite sa pertinence pour les tâches exigeant une exécution fidèle de consignes complexes. Sa fenêtre de contexte de 4 095 tokens est courte au regard des standards actuels, et sa coupure de connaissances en 2021 réduit l’intérêt pour les sujets récents. Son ancienneté implique aussi qu’il est souvent retiré du catalogue de l’éditeur aujourd’hui, ou remplacé par des modèles plus récents, plus robustes et mieux alignés.


Sources des données : OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0 · Benchable.ai (benchable.ai).