Mistral Large 3

Mistral Large 3 est un LLM de Mistral AI publié le 1 septembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine très grande taille, 675 milliards de paramètres, et fenêtre de contexte longue, avec 128 000 tokens.

Mistral Large 3 est un LLM de Mistral AI publié le 1 septembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine très grande taille, 675 milliards de paramètres, et fenêtre de contexte longue, avec 128 000 tokens.

Le modèle se distingue surtout par son profil ouvert à grande échelle. À sa sortie, il se situait dans le top 5% sur MATH parmi les LLM de sa génération, un signal fort pour le raisonnement mathématique évalué sur cette période.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMistral AI
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie1 septembre 2025
Multimodaloui
Paramètres675 milliards
Fenêtre de contexte128 000 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MATH90,4 %3ᵉ / 70llm-statsAuto-déclaré
MM-MT-Bench84,9 %1ᵉ / 17llm-statsAuto-déclaré
MMLU-Redux82,0 %36ᵉ / 48llm-statsAuto-déclaré
TriviaQA74,9 %9ᵉ / 18llm-statsAuto-déclaré
MMMLU74,2 %43ᵉ / 49llm-statsAuto-déclaré
Wild Bench68,5 %1ᵉ / 8llm-statsAuto-déclaré
MATH (CoT)67,6 %2ᵉ / 6llm-statsAuto-déclaré
Arena Hard55,1 %16ᵉ / 26llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Classements Arena (Elo)

CatégorieEloRang
Arena Text1416101ᵉ
Arena Code122382ᵉ

Notre analyse

Forces. Mistral Large 3 présente un profil rare dans les données disponibles : un très grand LLM open-weights, exploitable commercialement, avec une fenêtre de contexte de 128 000 tokens. Sa meilleure indication de performance concerne MATH, où il figurait à sa sortie dans le haut du panier de sa génération, parmi 63 LLM comparables sur une période de ±9 mois. Ce résultat le situe comme un modèle particulièrement solide, à son époque, pour le raisonnement mathématique évalué par ce benchmark. La licence Apache 2.0 renforce aussi son intérêt pratique, car elle autorise des déploiements commerciaux sans dépendre uniquement d’une API propriétaire.

Limites et points d'attention. Les classements Arena text et Arena code ne le placent pas parmi les tout premiers modèles des arènes publiques, même si Arena code apparaît mieux positionné que Arena text. La couverture reste limitée à 2 sources de données concordantes, ce qui donne une base vérifiable mais assez étroite pour juger l’ensemble de ses usages. Le volume de 675 milliards de paramètres implique aussi un modèle lourd à exploiter, sans information fournie ici sur le coût d’inférence ou l’infrastructure nécessaire. Mistral Large 3 convient surtout aux comparaisons et déploiements recherchant un très grand LLM open-weights, à contexte long, avec autorisation commerciale.


Sources des données : LLM-Stats (llm-stats.com) · Arena.ai (arena.ai).