Mistral AI

Mistral Large 3

Mistral Large 3 est un LLM de Mistral AI publié le 1 septembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine très grande taille, 675 milliards de paramètres, et fenêtre de contexte longue, avec 128 000 tokens.

Le modèle se distingue surtout par son profil ouvert à grande échelle. À sa sortie, il se situait dans le top 5% sur MATH parmi les LLM de sa génération, un signal fort pour le raisonnement mathématique évalué sur cette période.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	1 septembre 2025
Multimodal	oui
Paramètres	675 milliards
Fenêtre de contexte	128 000 tokens
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MATH	90,4 %	3ᵉ / 70	llm-stats	Auto-déclaré
MM-MT-Bench	84,9 %	1ᵉ / 17	llm-stats	Auto-déclaré
MMLU-Redux	82,0 %	36ᵉ / 48	llm-stats	Auto-déclaré
TriviaQA	74,9 %	9ᵉ / 18	llm-stats	Auto-déclaré
MMMLU	74,2 %	43ᵉ / 49	llm-stats	Auto-déclaré
Wild Bench	68,5 %	1ᵉ / 8	llm-stats	Auto-déclaré
MATH (CoT)	67,6 %	2ᵉ / 6	llm-stats	Auto-déclaré
Arena Hard	55,1 %	16ᵉ / 26	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1416	101ᵉ
Arena Code	1223	82ᵉ

Notre analyse

Forces. Mistral Large 3 présente un profil rare dans les données disponibles : un très grand LLM open-weights, exploitable commercialement, avec une fenêtre de contexte de 128 000 tokens. Sa meilleure indication de performance concerne MATH, où il figurait à sa sortie dans le haut du panier de sa génération, parmi 63 LLM comparables sur une période de ±9 mois. Ce résultat le situe comme un modèle particulièrement solide, à son époque, pour le raisonnement mathématique évalué par ce benchmark. La licence Apache 2.0 renforce aussi son intérêt pratique, car elle autorise des déploiements commerciaux sans dépendre uniquement d’une API propriétaire.

Limites et points d'attention. Les classements Arena text et Arena code ne le placent pas parmi les tout premiers modèles des arènes publiques, même si Arena code apparaît mieux positionné que Arena text. La couverture reste limitée à 2 sources de données concordantes, ce qui donne une base vérifiable mais assez étroite pour juger l’ensemble de ses usages. Le volume de 675 milliards de paramètres implique aussi un modèle lourd à exploiter, sans information fournie ici sur le coût d’inférence ou l’infrastructure nécessaire. Mistral Large 3 convient surtout aux comparaisons et déploiements recherchant un très grand LLM open-weights, à contexte long, avec autorisation commerciale.

Sources des données : LLM-Stats (llm-stats.com) · Arena.ai (arena.ai).

Mistral Large 3

Caractéristiques

Performances (benchmarks)

Classements Arena (Elo)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast