Ministral 3 (14B Reasoning 2512)

Ministral 3 (14B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025. Ce modèle open-weights sous licence Apache 2.0 autorise les usages commerciaux, avec un format de 14 milliards de paramètres qui le place dans la catégorie des modèles intermédiaires plutôt que des très…

Ministral 3 (14B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025. Ce modèle open-weights sous licence Apache 2.0 autorise les usages commerciaux, avec un format de 14 milliards de paramètres qui le place dans la catégorie des modèles intermédiaires plutôt que des très grands modèles frontière.

Sa caractéristique la plus visible est sa fenêtre de contexte de 262 100 tokens, rare à ce niveau de taille. À sa sortie, son classement sur GPQA le situait dans la moitié supérieure des LLM de sa génération, sans le placer parmi les modèles les plus dominants.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMistral AI
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie4 décembre 2025
Multimodaloui
Paramètres14 milliards
Fenêtre de contexte262 100 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
AIME 202489,8 %9ᵉ / 52llm-statsAuto-déclaré
AIME 202585,0 %56ᵉ / 108llm-statsAuto-déclaré
GPQA71,2 %107ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench64,6 %27ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Ministral 3 (14B Reasoning 2512) combine trois éléments concrets : des poids ouverts, une licence Apache 2.0 compatible avec un usage commercial, et une très grande fenêtre de contexte pour un modèle de 14 milliards de paramètres. À sa sortie, son résultat sur GPQA le plaçait dans le top 41% des 147 LLM comparables de la même période, ce qui indique un positionnement solide dans sa génération plutôt qu’un simple modèle d’entrée de gamme. Son intérêt principal tient donc à l’équilibre entre ouverture, taille contenue et capacité à traiter de longs contextes.

Limites et points d'attention. Le classement GPQA reste celui d’un modèle de milieu haut de tableau, pas d’un modèle frontière. Les faits disponibles ne documentent pas d’autres benchmarks, ni les performances en code, en agentique, en mathématiques avancées ou en usages multimodaux. La fiche repose aussi sur 1 source de données concordante, ce qui limite la profondeur de validation externe. Ministral 3 (14B Reasoning 2512) vise surtout les environnements qui privilégient un modèle ouvert, commercialement exploitable et doté d’un très long contexte, sans rechercher le meilleur niveau absolu de performance.


Sources des données : LLM-Stats (llm-stats.com).