Mistral AI

Mistral Large 3 (675B Instruct 2512 NVFP4)

Mistral Large 3 (675B Instruct 2512 NVFP4) est un LLM de Mistral AI sorti le 4 décembre 2025, avec 675 milliards de paramètres. Son positionnement combine une très grande taille de modèle et une diffusion en open-weights sous licence Apache 2.0.

La licence autorise l’usage commercial, ce qui distingue ce modèle des systèmes uniquement accessibles par API fermée. À sa sortie, son classement GPQA le situe dans le top 78% des LLM de sa génération, parmi 147 modèles comparés sur une période de plus ou moins neuf mois.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	4 décembre 2025
Multimodal	oui
Paramètres	675 milliards

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MMMLU	85,5 %	28ᵉ / 49	llm-stats	Auto-déclaré
AMC_2022_23	52,0 %	1ᵉ / 6	llm-stats	Auto-déclaré
GPQA	43,9 %	172ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	34,4 %	53ᵉ / 72	llm-stats	Auto-déclaré
SimpleQA	23,8 %	30ᵉ / 45	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Le principal atout documenté de Mistral Large 3 (675B Instruct 2512 NVFP4) est l’association d’un très grand modèle, 675 milliards de paramètres, et d’une licence Apache 2.0 permettant l’exploitation commerciale. Ce statut open-weights en fait un modèle plus contrôlable qu’un service fermé, notamment pour les organisations qui veulent héberger, adapter ou auditer leurs propres déploiements. Sur GPQA, son classement à la sortie le place dans la cohorte mesurée des LLM de sa génération, avec une position établie face à 147 modèles contemporains.

Limites et points d'attention. Le classement GPQA fourni ne signale pas un modèle de tête, mais un positionnement dans le top 78% de sa période de sortie. Aucune autre mesure vérifiée n’est disponible ici pour juger le code, les usages agentiques, les mathématiques avancées ou la performance en production. La couverture repose sur une seule source de données concordante, ce qui limite la profondeur de validation indépendante. Le modèle convient surtout aux évaluations et déploiements nécessitant des poids ouverts, une licence commerciale permissive et un très grand LLM signé Mistral AI.

Sources des données : LLM-Stats (llm-stats.com).

Mistral Large 3 (675B Instruct 2512 NVFP4)

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast