Ministral 8B Instruct
Ministral 8B Instruct est un LLM de Mistral AI sorti le 16 octobre 2024. Avec 8 milliards de paramètres et une fenêtre de contexte de 128 000 tokens, il se place dans la catégorie des modèles compacts à grand contexte de sa génération.
Ministral 8B Instruct est un LLM de Mistral AI sorti le 16 octobre 2024. Avec 8 milliards de paramètres et une fenêtre de contexte de 128 000 tokens, il se place dans la catégorie des modèles compacts à grand contexte de sa génération.
Son ancienneté, proche de deux ans, est très importante à l’échelle de l’IA. La fiche sert donc surtout à situer un modèle Mistral de 2024, publié sous Mistral Research License avec des poids non ouverts, probablement dépassé par les offres plus récentes.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Licence | Mistral Research License (poids non ouverts) |
| Date de sortie | 16 octobre 2024 |
| Multimodal | non |
| Paramètres | 8 milliards |
| Fenêtre de contexte | 128 000 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MT-Bench | 83,0 % | 9ᵉ / 12 | llm-stats | Auto-déclaré |
| Winogrande | 75,3 % | 13ᵉ / 22 | llm-stats | Auto-déclaré |
| ARC-C | 71,9 % | 18ᵉ / 34 | llm-stats | Auto-déclaré |
| Arena Hard | 70,9 % | 11ᵉ / 26 | llm-stats | Auto-déclaré |
| TriviaQA | 65,5 % | 15ᵉ / 18 | llm-stats | Auto-déclaré |
| MMLU | 65,0 % | 90ᵉ / 98 | llm-stats | Auto-déclaré |
| MATH | 54,5 % | 51ᵉ / 70 | llm-stats | Auto-déclaré |
| AGIEval | 48,3 % | 9ᵉ / 10 | llm-stats | Auto-déclaré |
| HumanEval | 34,8 % | 65ᵉ / 65 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Ministral 8B Instruct se distingue d’abord par son format: 8 milliards de paramètres, ce qui en fait un modèle relativement compact, associé à une fenêtre de contexte de 128 000 tokens. À sa sortie, cette combinaison donnait un profil intéressant pour traiter de longs contenus sans relever de la catégorie des très grands modèles. Sur MATH, il se situait dans le top 64% des 39 LLM de la même période, soit un positionnement honorable mais non dominant dans sa génération.
Limites et points d’attention. Le modèle date d’octobre 2024, une ancienneté très longue pour le marché des LLM. Ses performances doivent donc être lues comme celles d’un modèle de sa période, pas comme un concurrent crédible des modèles haut de gamme actuels. Il est probablement dépassé aujourd’hui et souvent absent des catalogues récents de l’éditeur. Sa licence, Mistral Research License, indique aussi des poids non ouverts. Enfin, les informations consolidées reposent sur une seule source de données concordante, ce qui limite la robustesse des comparaisons disponibles.
Sources des données : LLM-Stats (llm-stats.com).