Mistral AI

Ministral 3 (8B Reasoning 2512)

Ministral 3 (8B Reasoning 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son format à 8 milliards de paramètres le place dans la catégorie des modèles relativement compacts, avec une variante…

Le modèle se distingue par une très large fenêtre de contexte de 262 100 tokens, inhabituelle pour un modèle de cette taille. À sa sortie, son résultat GPQA le situait dans le top 50% des LLM de sa génération, parmi 147 modèles évalués sur la même période.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	4 décembre 2025
Multimodal	oui
Paramètres	8 milliards
Fenêtre de contexte	262 100 tokens
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
AIME 2024	86,0 %	15ᵉ / 52	llm-stats	Auto-déclaré
AIME 2025	78,7 %	67ᵉ / 108	llm-stats	Auto-déclaré
GPQA	66,8 %	121ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	61,6 %	32ᵉ / 72	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Ministral 3 (8B Reasoning 2512) combine trois caractéristiques concrètes : un format 8B, une licence Apache 2.0 et une fenêtre de contexte de 262 100 tokens. Cette combinaison en fait un modèle ouvert exploitable commercialement, avec une capacité de traitement de longs contextes nettement mise en avant dans sa fiche technique. Sur GPQA, il se situait à sa sortie dans la moitié supérieure des LLM de sa période de comparaison, ce qui indique un niveau compétitif pour un modèle de cette taille, sans le placer parmi les tout premiers modèles haut de gamme.

Limites et points d'attention. Le signal de performance disponible reste limité à un classement GPQA et à une seule source de données concordantes, ce qui réduit la profondeur d'analyse possible sur le code, les usages agentiques, les mathématiques ou la qualité conversationnelle. Son positionnement dans le top 50% à sa sortie montre un modèle solide, mais pas dominant sur ce benchmark. L'intérêt principal porte donc sur le compromis entre poids ouverts, usage commercial autorisé, taille contenue et très grand contexte, plutôt que sur une supériorité générale face aux modèles frontière.

Sources des données : LLM-Stats (llm-stats.com).

Ministral 3 (8B Reasoning 2512)

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast