Mistral Small 3.1 24B Base
Mistral Small 3.1 24B Base est un LLM open-weights de Mistral AI, publié le 17 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Ce modèle de base compte 24 milliards de paramètres et se distingue surtout par une fenêtre de contexte très large de 128 000 tokens.
Mistral Small 3.1 24B Base est un LLM open-weights de Mistral AI, publié le 17 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Ce modèle de base compte 24 milliards de paramètres et se distingue surtout par une fenêtre de contexte très large de 128 000 tokens.
Son ancienneté, environ un an, est déjà importante à l’échelle de l’IA générative. La fiche doit donc le lire comme un modèle de sa période, pas comme une référence actuelle : ses performances sont probablement dépassées par les générations plus récentes.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 17 mars 2025 |
| Multimodal | oui |
| Paramètres | 24 milliards |
| Fenêtre de contexte | 128 000 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MMLU | 81,0 % | 52ᵉ / 98 | llm-stats | Auto-déclaré |
| TriviaQA | 80,5 % | 4ᵉ / 18 | llm-stats | Auto-déclaré |
| MMMU | 59,3 % | 44ᵉ / 61 | llm-stats | Auto-déclaré |
| MMLU-Pro | 56,0 % | 104ᵉ / 125 | llm-stats | Auto-déclaré |
| GPQA | 37,5 % | 188ᵉ / 213 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. À sa sortie, Mistral Small 3.1 24B Base se situait dans une zone compétitive de sa génération sur GPQA, avec un classement dans le top 79% des LLM comparables publiés dans la même période. Sa licence Apache 2.0 constitue un atout concret : les poids sont ouverts et l’usage commercial est autorisé, ce qui le distingue des modèles fermés ou soumis à des restrictions plus fortes. Sa fenêtre de contexte de 128 000 tokens est également un point notable pour un modèle de cette taille, car elle permet de traiter des entrées longues dans le cadre prévu par le modèle.
Limites et points d'attention. Le principal point faible est son âge : environ un an représente un cycle très long dans l’IA, et le modèle doit être comparé aux LLM de début 2025 plutôt qu’aux modèles actuels. Ses performances sont aujourd’hui probablement largement dépassées, et ce type de modèle est souvent retiré du catalogue actif de l’éditeur. La couverture disponible repose sur une seule source de données concordante, ce qui limite la robustesse des conclusions au-delà des caractéristiques vérifiées.
Sources des données : LLM-Stats (llm-stats.com).