Ministral 3 (8B Reasoning 2512)

Ministral 3 (8B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son format à 8 milliards de paramètres le place dans la catégorie des modèles relativement compacts, avec une variante…

Ministral 3 (8B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son format à 8 milliards de paramètres le place dans la catégorie des modèles relativement compacts, avec une variante explicitement orientée raisonnement.

Le modèle se distingue par une très large fenêtre de contexte de 262 100 tokens, inhabituelle pour un modèle de cette taille. À sa sortie, son résultat GPQA le situait dans le top 50% des LLM de sa génération, parmi 147 modèles évalués sur la même période.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMistral AI
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie4 décembre 2025
Multimodaloui
Paramètres8 milliards
Fenêtre de contexte262 100 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
AIME 202486,0 %15ᵉ / 52llm-statsAuto-déclaré
AIME 202578,7 %67ᵉ / 108llm-statsAuto-déclaré
GPQA66,8 %121ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench61,6 %32ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Ministral 3 (8B Reasoning 2512) combine trois caractéristiques concrètes : un format 8B, une licence Apache 2.0 et une fenêtre de contexte de 262 100 tokens. Cette combinaison en fait un modèle ouvert exploitable commercialement, avec une capacité de traitement de longs contextes nettement mise en avant dans sa fiche technique. Sur GPQA, il se situait à sa sortie dans la moitié supérieure des LLM de sa période de comparaison, ce qui indique un niveau compétitif pour un modèle de cette taille, sans le placer parmi les tout premiers modèles haut de gamme.

Limites et points d'attention. Le signal de performance disponible reste limité à un classement GPQA et à une seule source de données concordantes, ce qui réduit la profondeur d'analyse possible sur le code, les usages agentiques, les mathématiques ou la qualité conversationnelle. Son positionnement dans le top 50% à sa sortie montre un modèle solide, mais pas dominant sur ce benchmark. L'intérêt principal porte donc sur le compromis entre poids ouverts, usage commercial autorisé, taille contenue et très grand contexte, plutôt que sur une supériorité générale face aux modèles frontière.


Sources des données : LLM-Stats (llm-stats.com).