Mistral: Ministral 8B

Mistral: Ministral 8B est un LLM de Mistral AI sorti le 17 octobre 2024. Avec environ deux ans d’ancienneté, il appartient déjà à une génération lointaine à l’échelle de l’IA, à comparer d’abord aux modèles disponibles autour de sa sortie plutôt qu’aux systèmes actuels.

Mistral: Ministral 8B est un LLM de Mistral AI sorti le 17 octobre 2024. Avec environ deux ans d’ancienneté, il appartient déjà à une génération lointaine à l’échelle de l’IA, à comparer d’abord aux modèles disponibles autour de sa sortie plutôt qu’aux systèmes actuels.

Son trait le plus distinctif dans les données disponibles est sa fenêtre de contexte de 128 000 tokens, élevée pour traiter de longs documents ou maintenir un échange étendu. Ses connaissances s’arrêtent au 30 septembre 2024, juste avant sa publication.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMistral AI
Date de sortie17 octobre 2024
Connaissances jusqu'à2024-09-30
Multimodalnon
Fenêtre de contexte128 000 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: GPQA diamond27,1 %125ᵉ / 132epoch✅ Mesuré
Epoch: MATH level 514,9 %72ᵉ / 84epoch✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: GPQA diamond

Qwen3.7 Max92 %
Phi 456 %
▶ Ministral 8B27 %

Epoch: MATH level 5

GPT-598 %
Qwen3-Max-Instruct97 %
Phi 465 %
▶ Ministral 8B15 %

Notre analyse

Forces. Mistral: Ministral 8B se distingue surtout par son contexte long, qui constituait un argument concret à sa sortie pour analyser ou produire du texte sur de grands volumes. Sur GPQA diamond (questions scientifiques niveau doctorat), son positionnement à la sortie le plaçait dans le top 85% des LLM de sa génération, parmi les modèles publiés dans une fenêtre comparable. Cette indication situe le modèle comme un système exploitable dans le paysage de fin 2024, sans le placer dans le tout premier groupe. La proximité entre sa date de coupure des connaissances et sa date de sortie limitait aussi le décalage informationnel au moment du lancement.

Limites et points d'attention. Ses résultats bruts signalent des faiblesses nettes sur les tâches difficiles de raisonnement scientifique et mathématique. GPQA diamond le classe très bas dans l’ensemble des modèles mesurés, et MATH level 5 confirme une performance limitée sur les problèmes mathématiques exigeants. Avec environ deux ans d’ancienneté, ses performances sont aujourd’hui largement dépassées par les modèles haut de gamme plus récents, et ce type de modèle est souvent retiré ou remplacé dans les catalogues éditeurs. Aucune donnée fournie ne documente ici un effort d’entraînement en GPU H100 ou en coût, ce qui empêche de mettre en avant cet aspect.


Sources des données : OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.