Ministral 3 (8B Base 2512)

Ministral 3 (8B Base 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé.

Ministral 3 (8B Base 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé.

Avec 8 milliards de paramètres, il appartient à la catégorie des modèles relativement compacts. À sa sortie, il se situait dans le top 71% des LLM de sa génération sur MMLU, un repère utile pour évaluer son niveau général à cette période.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMistral AI
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie4 décembre 2025
Multimodaloui
Paramètres8 milliards

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MMLU-Redux79,3 %41ᵉ / 48llm-statsAuto-déclaré
MMLU76,1 %71ᵉ / 98llm-statsAuto-déclaré
Multilingual MMLU70,6 %3ᵉ / 5llm-statsAuto-déclaré
TriviaQA68,1 %14ᵉ / 18llm-statsAuto-déclaré
MATH (CoT)62,6 %4ᵉ / 6llm-statsAuto-déclaré
AGIEval59,1 %3ᵉ / 10llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Le principal atout de Ministral 3 (8B Base 2512) tient à sa licence Apache 2.0, qui autorise l’usage commercial et la modification des poids. Ce positionnement open-weights le distingue des modèles accessibles uniquement via API fermée. Son format à 8 milliards de paramètres le place dans une famille de LLM plus légère que les grands modèles haut de gamme, ce qui peut compter pour des projets où la maîtrise du modèle et de son déploiement est centrale. Sur MMLU, benchmark généraliste de connaissances et de raisonnement, il figurait à sa sortie dans le top 71% des LLM comparables de la même période.

Limites et points d'attention. Le classement MMLU indique un niveau situé dans la partie supérieure large de sa génération, sans signaler une position de tête. Aucune autre mesure vérifiée n’est disponible ici pour qualifier le code, les agents, les mathématiques avancées ou les performances multilingues. La couverture repose sur 1 source de données concordante, ce qui limite la profondeur de vérification. Le modèle reste surtout pertinent lorsque la licence ouverte, l’usage commercial autorisé et le format 8B priment sur la recherche des meilleures performances absolues.


Sources des données : LLM-Stats (llm-stats.com).