Mistral Large 3 (675B Instruct 2512 NVFP4)
Mistral Large 3 (675B Instruct 2512 NVFP4) est un LLM de Mistral AI sorti le 4 décembre 2025, avec 675 milliards de paramètres. Son positionnement combine une très grande taille de modèle et une diffusion en open-weights sous licence Apache 2.0.
Mistral Large 3 (675B Instruct 2512 NVFP4) est un LLM de Mistral AI sorti le 4 décembre 2025, avec 675 milliards de paramètres. Son positionnement combine une très grande taille de modèle et une diffusion en open-weights sous licence Apache 2.0.
La licence autorise l’usage commercial, ce qui distingue ce modèle des systèmes uniquement accessibles par API fermée. À sa sortie, son classement GPQA le situe dans le top 78% des LLM de sa génération, parmi 147 modèles comparés sur une période de plus ou moins neuf mois.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 4 décembre 2025 |
| Multimodal | oui |
| Paramètres | 675 milliards |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MMMLU | 85,5 % | 28ᵉ / 49 | llm-stats | Auto-déclaré |
| AMC_2022_23 | 52,0 % | 1ᵉ / 6 | llm-stats | Auto-déclaré |
| GPQA | 43,9 % | 172ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench | 34,4 % | 53ᵉ / 72 | llm-stats | Auto-déclaré |
| SimpleQA | 23,8 % | 30ᵉ / 45 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Le principal atout documenté de Mistral Large 3 (675B Instruct 2512 NVFP4) est l’association d’un très grand modèle, 675 milliards de paramètres, et d’une licence Apache 2.0 permettant l’exploitation commerciale. Ce statut open-weights en fait un modèle plus contrôlable qu’un service fermé, notamment pour les organisations qui veulent héberger, adapter ou auditer leurs propres déploiements. Sur GPQA, son classement à la sortie le place dans la cohorte mesurée des LLM de sa génération, avec une position établie face à 147 modèles contemporains.
Limites et points d'attention. Le classement GPQA fourni ne signale pas un modèle de tête, mais un positionnement dans le top 78% de sa période de sortie. Aucune autre mesure vérifiée n’est disponible ici pour juger le code, les usages agentiques, les mathématiques avancées ou la performance en production. La couverture repose sur une seule source de données concordante, ce qui limite la profondeur de validation indépendante. Le modèle convient surtout aux évaluations et déploiements nécessitant des poids ouverts, une licence commerciale permissive et un très grand LLM signé Mistral AI.
Sources des données : LLM-Stats (llm-stats.com).