Devstral Small 1.1
Devstral Small 1.1 est un LLM de Mistral AI publié le 11 juillet 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine un format de 24 milliards de paramètres, une fenêtre de contexte de 131 072 tokens et une évaluation publique…
Devstral Small 1.1 est un LLM de Mistral AI publié le 11 juillet 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine un format de 24 milliards de paramètres, une fenêtre de contexte de 131 072 tokens et une évaluation publique sur SWE-Bench Verified.
À sa sortie, Devstral Small 1.1 se situait dans le top 58% des LLM de sa génération sur SWE-Bench Verified, parmi 31 modèles comparables publiés dans une fenêtre de neuf mois autour de sa date de lancement. Ses connaissances déclarées s’arrêtent au 31 mars 2025.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 11 juillet 2025 |
| Connaissances jusqu'à | 2025-03-31 |
| Multimodal | non |
| Paramètres | 24 milliards |
| Fenêtre de contexte | 131 072 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| SWE-Bench Verified | 53,6 % | 83ᵉ / 100 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Devstral Small 1.1 se distingue d’abord par son cadre de diffusion : les poids sont ouverts et la licence Apache 2.0 autorise les usages commerciaux, ce qui en fait un modèle exploitable hors d’une offre strictement fermée. Sa fenêtre de contexte de 131 072 tokens permet de traiter de longs volumes de texte dans une même requête, un point important pour l’analyse de dépôts, de documents techniques ou de conversations étendues. Sur SWE-Bench Verified (mesure de résolution de problèmes logiciels à partir de dépôts réels), il se plaçait à sa sortie dans le top 58% des LLM de sa période, ce qui le situe dans une zone compétitive, sans le placer parmi les tout premiers modèles évalués.
Limites et points d'attention. Les informations vérifiées disponibles restent limitées : la fiche repose sur deux sources de données concordantes et ne fournit pas d’autres résultats publics sur des indices comme Intelligence Index, Code Index, Agentic Index ou GPQA. Le classement SWE-Bench Verified indique une performance située dans la moitié supérieure élargie de sa génération, mais pas un niveau de modèle haut de gamme. La coupure de connaissances au 31 mars 2025 impose aussi une limite nette sur les faits postérieurs. Devstral Small 1.1 convient surtout aux usages où l’ouverture des poids, la licence commerciale et le long contexte priment sur la recherche du meilleur score absolu.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).