Mistral: Ministral 3B
Mistral: Ministral 3B est un LLM de Mistral AI publié le 17 octobre 2024, avec des connaissances arrêtées au 30 septembre 2024. À l’échelle de l’IA générative, son ancienneté proche de deux ans le place déjà dans une génération passée, à comparer d’abord aux modèles disponibles autour de…
Mistral: Ministral 3B est un LLM de Mistral AI publié le 17 octobre 2024, avec des connaissances arrêtées au 30 septembre 2024. À l’échelle de l’IA générative, son ancienneté proche de deux ans le place déjà dans une génération passée, à comparer d’abord aux modèles disponibles autour de sa sortie.
Sa caractéristique la plus visible est une fenêtre de contexte de 128 000 tokens, importante pour un modèle de cette période. Les données disponibles, issues de deux sources concordantes, permettent surtout de le situer comme un modèle historiquement intéressant plutôt que comme une référence actuelle.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Date de sortie | 17 octobre 2024 |
| Connaissances jusqu'à | 2024-09-30 |
| Multimodal | non |
| Fenêtre de contexte | 128 000 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: GPQA diamond | 25,3 % | 129ᵉ / 132 | epoch | ✅ Mesuré |
| Epoch: MATH level 5 | 14,4 % | 74ᵉ / 84 | epoch | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Epoch: GPQA diamond
Epoch: MATH level 5
Notre analyse
Forces. À sa sortie, Mistral: Ministral 3B se distinguait surtout par son positionnement relatif sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat, où il figurait dans le haut du panier des LLM de sa génération. Sa fenêtre de contexte de 128 000 tokens constituait aussi un atout concret pour traiter des entrées longues, notamment dans les usages où la quantité de texte fournie au modèle compte davantage que la performance de raisonnement pur. Pour un modèle publié fin 2024, cet équilibre entre format compact implicite dans son nom, contexte étendu et classement générationnel favorable explique son intérêt historique.
Limites et points d’attention. Les résultats bruts disponibles montrent des faiblesses nettes sur les tâches difficiles: GPQA diamond reste bas en score absolu et MATH level 5, centré sur des problèmes mathématiques exigeants, le place en retrait. Avec près de deux ans d’ancienneté, ses performances sont aujourd’hui largement dépassées par les modèles haut de gamme plus récents, et ce type de modèle est souvent retiré du catalogue de l’éditeur. Aucun chiffre d’entraînement, de coût ou d’équivalent GPU H100 n’est fourni dans les données vérifiées, ce qui limite l’analyse de son effort de développement.
Sources des données : OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.