Mistral Large 3
Mistral Large 3 est un LLM de Mistral AI publié le 1 septembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine très grande taille, 675 milliards de paramètres, et fenêtre de contexte longue, avec 128 000 tokens.
Mistral Large 3 est un LLM de Mistral AI publié le 1 septembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine très grande taille, 675 milliards de paramètres, et fenêtre de contexte longue, avec 128 000 tokens.
Le modèle se distingue surtout par son profil ouvert à grande échelle. À sa sortie, il se situait dans le top 5% sur MATH parmi les LLM de sa génération, un signal fort pour le raisonnement mathématique évalué sur cette période.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 1 septembre 2025 |
| Multimodal | oui |
| Paramètres | 675 milliards |
| Fenêtre de contexte | 128 000 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MATH | 90,4 % | 3ᵉ / 70 | llm-stats | Auto-déclaré |
| MM-MT-Bench | 84,9 % | 1ᵉ / 17 | llm-stats | Auto-déclaré |
| MMLU-Redux | 82,0 % | 36ᵉ / 48 | llm-stats | Auto-déclaré |
| TriviaQA | 74,9 % | 9ᵉ / 18 | llm-stats | Auto-déclaré |
| MMMLU | 74,2 % | 43ᵉ / 49 | llm-stats | Auto-déclaré |
| Wild Bench | 68,5 % | 1ᵉ / 8 | llm-stats | Auto-déclaré |
| MATH (CoT) | 67,6 % | 2ᵉ / 6 | llm-stats | Auto-déclaré |
| Arena Hard | 55,1 % | 16ᵉ / 26 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1416 | 101ᵉ |
| Arena Code | 1223 | 82ᵉ |
Notre analyse
Forces. Mistral Large 3 présente un profil rare dans les données disponibles : un très grand LLM open-weights, exploitable commercialement, avec une fenêtre de contexte de 128 000 tokens. Sa meilleure indication de performance concerne MATH, où il figurait à sa sortie dans le haut du panier de sa génération, parmi 63 LLM comparables sur une période de ±9 mois. Ce résultat le situe comme un modèle particulièrement solide, à son époque, pour le raisonnement mathématique évalué par ce benchmark. La licence Apache 2.0 renforce aussi son intérêt pratique, car elle autorise des déploiements commerciaux sans dépendre uniquement d’une API propriétaire.
Limites et points d'attention. Les classements Arena text et Arena code ne le placent pas parmi les tout premiers modèles des arènes publiques, même si Arena code apparaît mieux positionné que Arena text. La couverture reste limitée à 2 sources de données concordantes, ce qui donne une base vérifiable mais assez étroite pour juger l’ensemble de ses usages. Le volume de 675 milliards de paramètres implique aussi un modèle lourd à exploiter, sans information fournie ici sur le coût d’inférence ou l’infrastructure nécessaire. Mistral Large 3 convient surtout aux comparaisons et déploiements recherchant un très grand LLM open-weights, à contexte long, avec autorisation commerciale.
Sources des données : LLM-Stats (llm-stats.com) · Arena.ai (arena.ai).