Mistral AI

Mistral: Ministral 3B

Mistral: Ministral 3B est un LLM de Mistral AI publié le 17 octobre 2024, avec des connaissances arrêtées au 30 septembre 2024. À l’échelle de l’IA générative, son ancienneté proche de deux ans le place déjà dans une génération passée, à comparer d’abord aux modèles disponibles autour de…

Sa caractéristique la plus visible est une fenêtre de contexte de 128 000 tokens, importante pour un modèle de cette période. Les données disponibles, issues de deux sources concordantes, permettent surtout de le situer comme un modèle historiquement intéressant plutôt que comme une référence actuelle.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Date de sortie	17 octobre 2024
Connaissances jusqu'à	2024-09-30
Multimodal	non
Fenêtre de contexte	128 000 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Epoch: GPQA diamond	25,3 %	129ᵉ / 132	epoch	✅ Mesuré
Epoch: MATH level 5	14,4 %	74ᵉ / 84	epoch	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: GPQA diamond

GPT-5.4 Pro95 %

Gemini 3.1 Pro Preview94 %

Qwen3.7 Max92 %

Phi 456 %

▶ Ministral 3B25 %

Epoch: MATH level 5

GPT-598 %

Claude Sonnet 4.598 %

Qwen3-Max-Instruct97 %

Phi 465 %

▶ Ministral 3B14 %

Notre analyse

Forces. À sa sortie, Mistral: Ministral 3B se distinguait surtout par son positionnement relatif sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat, où il figurait dans le haut du panier des LLM de sa génération. Sa fenêtre de contexte de 128 000 tokens constituait aussi un atout concret pour traiter des entrées longues, notamment dans les usages où la quantité de texte fournie au modèle compte davantage que la performance de raisonnement pur. Pour un modèle publié fin 2024, cet équilibre entre format compact implicite dans son nom, contexte étendu et classement générationnel favorable explique son intérêt historique.

Limites et points d’attention. Les résultats bruts disponibles montrent des faiblesses nettes sur les tâches difficiles: GPQA diamond reste bas en score absolu et MATH level 5, centré sur des problèmes mathématiques exigeants, le place en retrait. Avec près de deux ans d’ancienneté, ses performances sont aujourd’hui largement dépassées par les modèles haut de gamme plus récents, et ce type de modèle est souvent retiré du catalogue de l’éditeur. Aucun chiffre d’entraînement, de coût ou d’équivalent GPU H100 n’est fourni dans les données vérifiées, ce qui limite l’analyse de son effort de développement.

Sources des données : OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.

Mistral: Ministral 3B

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast