Mistral: Ministral 8B
Mistral: Ministral 8B est un LLM de Mistral AI sorti le 17 octobre 2024. Avec environ deux ans d’ancienneté, il appartient déjà à une génération lointaine à l’échelle de l’IA, à comparer d’abord aux modèles disponibles autour de sa sortie plutôt qu’aux systèmes actuels.
Mistral: Ministral 8B est un LLM de Mistral AI sorti le 17 octobre 2024. Avec environ deux ans d’ancienneté, il appartient déjà à une génération lointaine à l’échelle de l’IA, à comparer d’abord aux modèles disponibles autour de sa sortie plutôt qu’aux systèmes actuels.
Son trait le plus distinctif dans les données disponibles est sa fenêtre de contexte de 128 000 tokens, élevée pour traiter de longs documents ou maintenir un échange étendu. Ses connaissances s’arrêtent au 30 septembre 2024, juste avant sa publication.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Date de sortie | 17 octobre 2024 |
| Connaissances jusqu'à | 2024-09-30 |
| Multimodal | non |
| Fenêtre de contexte | 128 000 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: GPQA diamond | 27,1 % | 125ᵉ / 132 | epoch | ✅ Mesuré |
| Epoch: MATH level 5 | 14,9 % | 72ᵉ / 84 | epoch | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Epoch: GPQA diamond
Epoch: MATH level 5
Notre analyse
Forces. Mistral: Ministral 8B se distingue surtout par son contexte long, qui constituait un argument concret à sa sortie pour analyser ou produire du texte sur de grands volumes. Sur GPQA diamond (questions scientifiques niveau doctorat), son positionnement à la sortie le plaçait dans le top 85% des LLM de sa génération, parmi les modèles publiés dans une fenêtre comparable. Cette indication situe le modèle comme un système exploitable dans le paysage de fin 2024, sans le placer dans le tout premier groupe. La proximité entre sa date de coupure des connaissances et sa date de sortie limitait aussi le décalage informationnel au moment du lancement.
Limites et points d'attention. Ses résultats bruts signalent des faiblesses nettes sur les tâches difficiles de raisonnement scientifique et mathématique. GPQA diamond le classe très bas dans l’ensemble des modèles mesurés, et MATH level 5 confirme une performance limitée sur les problèmes mathématiques exigeants. Avec environ deux ans d’ancienneté, ses performances sont aujourd’hui largement dépassées par les modèles haut de gamme plus récents, et ce type de modèle est souvent retiré ou remplacé dans les catalogues éditeurs. Aucune donnée fournie ne documente ici un effort d’entraînement en GPU H100 ou en coût, ce qui empêche de mettre en avant cet aspect.
Sources des données : OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.