Mistral AI

Devstral Small 1.1

Devstral Small 1.1 est un LLM de Mistral AI publié le 11 juillet 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine un format de 24 milliards de paramètres, une fenêtre de contexte de 131 072 tokens et une évaluation publique…

À sa sortie, Devstral Small 1.1 se situait dans le top 58% des LLM de sa génération sur SWE-Bench Verified, parmi 31 modèles comparables publiés dans une fenêtre de neuf mois autour de sa date de lancement. Ses connaissances déclarées s’arrêtent au 31 mars 2025.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	11 juillet 2025
Connaissances jusqu'à	2025-03-31
Multimodal	non
Paramètres	24 milliards
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
SWE-Bench Verified	53,6 %	83ᵉ / 100	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Devstral Small 1.1 se distingue d’abord par son cadre de diffusion : les poids sont ouverts et la licence Apache 2.0 autorise les usages commerciaux, ce qui en fait un modèle exploitable hors d’une offre strictement fermée. Sa fenêtre de contexte de 131 072 tokens permet de traiter de longs volumes de texte dans une même requête, un point important pour l’analyse de dépôts, de documents techniques ou de conversations étendues. Sur SWE-Bench Verified (mesure de résolution de problèmes logiciels à partir de dépôts réels), il se plaçait à sa sortie dans le top 58% des LLM de sa période, ce qui le situe dans une zone compétitive, sans le placer parmi les tout premiers modèles évalués.

Limites et points d'attention. Les informations vérifiées disponibles restent limitées : la fiche repose sur deux sources de données concordantes et ne fournit pas d’autres résultats publics sur des indices comme Intelligence Index, Code Index, Agentic Index ou GPQA. Le classement SWE-Bench Verified indique une performance située dans la moitié supérieure élargie de sa génération, mais pas un niveau de modèle haut de gamme. La coupure de connaissances au 31 mars 2025 impose aussi une limite nette sur les faits postérieurs. Devstral Small 1.1 convient surtout aux usages où l’ouverture des poids, la licence commerciale et le long contexte priment sur la recherche du meilleur score absolu.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

Devstral Small 1.1

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast