Min istral 3 (3B Reasoning 2512)
Min istral 3 (3B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son format à 3 milliards de paramètres le place dans la catégorie des modèles compacts, tout en conservant une fenêtre de…
Min istral 3 (3B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son format à 3 milliards de paramètres le place dans la catégorie des modèles compacts, tout en conservant une fenêtre de contexte de 131 100 tokens.
À sa sortie, le modèle se situait dans les 65% les mieux classés sur GPQA parmi les LLM de sa génération. Cette position en fait un modèle ouvert à suivre pour les cas où la licence, la compacité et le contexte long comptent autant que le rang brut en benchmark.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 4 décembre 2025 |
| Multimodal | oui |
| Paramètres | 3 milliards |
| Fenêtre de contexte | 131 100 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| AIME 2024 | 77,5 % | 31ᵉ / 52 | llm-stats | Auto-déclaré |
| AIME 2025 | 72,1 % | 78ᵉ / 108 | llm-stats | Auto-déclaré |
| LiveCodeBench | 54,8 % | 37ᵉ / 72 | llm-stats | Auto-déclaré |
| GPQA | 53,4 % | 149ᵉ / 213 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Min istral 3 (3B Reasoning 2512) combine trois caractéristiques concrètes : des poids ouverts, une licence Apache 2.0 compatible avec un usage commercial, et un format de 3 milliards de paramètres. Sa fenêtre de contexte de 131 100 tokens le distingue nettement des petits LLM limités à des échanges courts. Sur GPQA, son classement à la sortie le place dans la partie supérieure de sa génération, sans le présenter comme un modèle de tout premier rang. Le modèle a donc un intérêt surtout comme base compacte, ouverte et commercialement exploitable, plutôt que comme vitrine de performance maximale.
Limites et points d'attention. Les données vérifiées ne reposent que sur une source concordante, ce qui limite la profondeur de l’évaluation publique disponible. Un seul repère de performance est fourni, GPQA, sans résultats confirmés sur le code, les usages agentiques, les mathématiques avancées ou les préférences humaines. Le classement top 65% indique une position correcte à sa sortie, mais pas une domination face aux meilleurs LLM de la même période. Min istral 3 (3B Reasoning 2512) convient surtout aux intégrations recherchant un LLM compact, open-weights et exploitable commercialement, avec un contexte long documenté.
Sources des données : LLM-Stats (llm-stats.com).