Mistral Small 3.1 24B Base

Mistral Small 3.1 24B Base est un LLM open-weights de Mistral AI, publié le 17 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Ce modèle de base compte 24 milliards de paramètres et se distingue surtout par une fenêtre de contexte très large de 128 000 tokens.

Mistral Small 3.1 24B Base est un LLM open-weights de Mistral AI, publié le 17 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Ce modèle de base compte 24 milliards de paramètres et se distingue surtout par une fenêtre de contexte très large de 128 000 tokens.

Son ancienneté, environ un an, est déjà importante à l’échelle de l’IA générative. La fiche doit donc le lire comme un modèle de sa période, pas comme une référence actuelle : ses performances sont probablement dépassées par les générations plus récentes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMistral AI
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie17 mars 2025
Multimodaloui
Paramètres24 milliards
Fenêtre de contexte128 000 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MMLU81,0 %52ᵉ / 98llm-statsAuto-déclaré
TriviaQA80,5 %4ᵉ / 18llm-statsAuto-déclaré
MMMU59,3 %44ᵉ / 61llm-statsAuto-déclaré
MMLU-Pro56,0 %104ᵉ / 125llm-statsAuto-déclaré
GPQA37,5 %188ᵉ / 213llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Mistral Small 3.1 24B Base se situait dans une zone compétitive de sa génération sur GPQA, avec un classement dans le top 79% des LLM comparables publiés dans la même période. Sa licence Apache 2.0 constitue un atout concret : les poids sont ouverts et l’usage commercial est autorisé, ce qui le distingue des modèles fermés ou soumis à des restrictions plus fortes. Sa fenêtre de contexte de 128 000 tokens est également un point notable pour un modèle de cette taille, car elle permet de traiter des entrées longues dans le cadre prévu par le modèle.

Limites et points d'attention. Le principal point faible est son âge : environ un an représente un cycle très long dans l’IA, et le modèle doit être comparé aux LLM de début 2025 plutôt qu’aux modèles actuels. Ses performances sont aujourd’hui probablement largement dépassées, et ce type de modèle est souvent retiré du catalogue actif de l’éditeur. La couverture disponible repose sur une seule source de données concordante, ce qui limite la robustesse des conclusions au-delà des caractéristiques vérifiées.


Sources des données : LLM-Stats (llm-stats.com).