Mistral AI

Ministral 3 (14B Reasoning 2512)

Ministral 3 (14B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025. Ce modèle open-weights sous licence Apache 2.0 autorise les usages commerciaux, avec un format de 14 milliards de paramètres qui le place dans la catégorie des modèles intermédiaires plutôt que des très…

Sa caractéristique la plus visible est sa fenêtre de contexte de 262 100 tokens, rare à ce niveau de taille. À sa sortie, son classement sur GPQA le situait dans la moitié supérieure des LLM de sa génération, sans le placer parmi les modèles les plus dominants.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	4 décembre 2025
Multimodal	oui
Paramètres	14 milliards
Fenêtre de contexte	262 100 tokens
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
AIME 2024	89,8 %	9ᵉ / 52	llm-stats	Auto-déclaré
AIME 2025	85,0 %	56ᵉ / 108	llm-stats	Auto-déclaré
GPQA	71,2 %	107ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	64,6 %	27ᵉ / 72	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Ministral 3 (14B Reasoning 2512) combine trois éléments concrets : des poids ouverts, une licence Apache 2.0 compatible avec un usage commercial, et une très grande fenêtre de contexte pour un modèle de 14 milliards de paramètres. À sa sortie, son résultat sur GPQA le plaçait dans le top 41% des 147 LLM comparables de la même période, ce qui indique un positionnement solide dans sa génération plutôt qu’un simple modèle d’entrée de gamme. Son intérêt principal tient donc à l’équilibre entre ouverture, taille contenue et capacité à traiter de longs contextes.

Limites et points d'attention. Le classement GPQA reste celui d’un modèle de milieu haut de tableau, pas d’un modèle frontière. Les faits disponibles ne documentent pas d’autres benchmarks, ni les performances en code, en agentique, en mathématiques avancées ou en usages multimodaux. La fiche repose aussi sur 1 source de données concordante, ce qui limite la profondeur de validation externe. Ministral 3 (14B Reasoning 2512) vise surtout les environnements qui privilégient un modèle ouvert, commercialement exploitable et doté d’un très long contexte, sans rechercher le meilleur niveau absolu de performance.

Sources des données : LLM-Stats (llm-stats.com).

Ministral 3 (14B Reasoning 2512)

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast