Min istral 3 (3B Reasoning 2512)

Min istral 3 (3B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son format à 3 milliards de paramètres le place dans la catégorie des modèles compacts, tout en conservant une fenêtre de…

Min istral 3 (3B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son format à 3 milliards de paramètres le place dans la catégorie des modèles compacts, tout en conservant une fenêtre de contexte de 131 100 tokens.

À sa sortie, le modèle se situait dans les 65% les mieux classés sur GPQA parmi les LLM de sa génération. Cette position en fait un modèle ouvert à suivre pour les cas où la licence, la compacité et le contexte long comptent autant que le rang brut en benchmark.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMistral AI
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie4 décembre 2025
Multimodaloui
Paramètres3 milliards
Fenêtre de contexte131 100 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
AIME 202477,5 %31ᵉ / 52llm-statsAuto-déclaré
AIME 202572,1 %78ᵉ / 108llm-statsAuto-déclaré
LiveCodeBench54,8 %37ᵉ / 72llm-statsAuto-déclaré
GPQA53,4 %149ᵉ / 213llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Min istral 3 (3B Reasoning 2512) combine trois caractéristiques concrètes : des poids ouverts, une licence Apache 2.0 compatible avec un usage commercial, et un format de 3 milliards de paramètres. Sa fenêtre de contexte de 131 100 tokens le distingue nettement des petits LLM limités à des échanges courts. Sur GPQA, son classement à la sortie le place dans la partie supérieure de sa génération, sans le présenter comme un modèle de tout premier rang. Le modèle a donc un intérêt surtout comme base compacte, ouverte et commercialement exploitable, plutôt que comme vitrine de performance maximale.

Limites et points d'attention. Les données vérifiées ne reposent que sur une source concordante, ce qui limite la profondeur de l’évaluation publique disponible. Un seul repère de performance est fourni, GPQA, sans résultats confirmés sur le code, les usages agentiques, les mathématiques avancées ou les préférences humaines. Le classement top 65% indique une position correcte à sa sortie, mais pas une domination face aux meilleurs LLM de la même période. Min istral 3 (3B Reasoning 2512) convient surtout aux intégrations recherchant un LLM compact, open-weights et exploitable commercialement, avec un contexte long documenté.


Sources des données : LLM-Stats (llm-stats.com).