Mistral AI

Min istral 3 (3B Reasoning 2512)

Min istral 3 (3B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son format à 3 milliards de paramètres le place dans la catégorie des modèles compacts, tout en conservant une fenêtre de…

À sa sortie, le modèle se situait dans les 65% les mieux classés sur GPQA parmi les LLM de sa génération. Cette position en fait un modèle ouvert à suivre pour les cas où la licence, la compacité et le contexte long comptent autant que le rang brut en benchmark.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	4 décembre 2025
Multimodal	oui
Paramètres	3 milliards
Fenêtre de contexte	131 100 tokens
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
AIME 2024	77,5 %	31ᵉ / 52	llm-stats	Auto-déclaré
AIME 2025	72,1 %	78ᵉ / 108	llm-stats	Auto-déclaré
LiveCodeBench	54,8 %	37ᵉ / 72	llm-stats	Auto-déclaré
GPQA	53,4 %	149ᵉ / 213	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Min istral 3 (3B Reasoning 2512) combine trois caractéristiques concrètes : des poids ouverts, une licence Apache 2.0 compatible avec un usage commercial, et un format de 3 milliards de paramètres. Sa fenêtre de contexte de 131 100 tokens le distingue nettement des petits LLM limités à des échanges courts. Sur GPQA, son classement à la sortie le place dans la partie supérieure de sa génération, sans le présenter comme un modèle de tout premier rang. Le modèle a donc un intérêt surtout comme base compacte, ouverte et commercialement exploitable, plutôt que comme vitrine de performance maximale.

Limites et points d'attention. Les données vérifiées ne reposent que sur une source concordante, ce qui limite la profondeur de l’évaluation publique disponible. Un seul repère de performance est fourni, GPQA, sans résultats confirmés sur le code, les usages agentiques, les mathématiques avancées ou les préférences humaines. Le classement top 65% indique une position correcte à sa sortie, mais pas une domination face aux meilleurs LLM de la même période. Min istral 3 (3B Reasoning 2512) convient surtout aux intégrations recherchant un LLM compact, open-weights et exploitable commercialement, avec un contexte long documenté.

Sources des données : LLM-Stats (llm-stats.com).

Min istral 3 (3B Reasoning 2512)

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast