Mistral AI

Mistral Large 3 (675B Instruct 2512)

Mistral Large 3 (675B Instruct 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine un très grand nombre de paramètres, une fenêtre de contexte très étendue et une tarification…

Le modèle se distingue surtout par son rapport coût-format : il est annoncé 74% moins cher que la moyenne des LLM similaires et environ 9,7 fois moins cher que les modèles frontière. Cette fiche le situe donc autant comme grand modèle open-weights que comme option économique à grande fenêtre de contexte.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	4 décembre 2025
Multimodal	oui
Paramètres	675 milliards
Fenêtre de contexte	262 100 tokens
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
PinchBench : agentique (OpenClaw, 147 tâches)	54,5 %	41ᵉ / 52	pinchbench	✅ Mesuré
MMMLU	85,5 %	28ᵉ / 49	llm-stats	Auto-déclaré
AMC_2022_23	52,0 %	1ᵉ / 6	llm-stats	Auto-déclaré
GPQA	43,9 %	172ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	34,4 %	53ᵉ / 72	llm-stats	Auto-déclaré
SimpleQA	23,8 %	30ᵉ / 45	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

PinchBench : agentique (OpenClaw, 147 tâches)

Qwen3.7 Max93 %

Claude Opus 4.891 %

Nemotron 3 Ultra90 %

Devstral 2 251269 %

▶ Mistral Large 354 %

nova-2-lite-v138 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
mistral	0,5 $	1,5 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 74 % en dessous de la moyenne des LLM similaires, et 9,7 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût par exécution agentique — PinchBench (147 tâches)	6,56 $
Durée d'exécution — PinchBench	4 h 25 min
Indice valeur/coût — PinchBench	152,37

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Mistral Large 3 (675B Instruct 2512) réunit trois atouts concrets : des poids ouverts sous Apache 2.0, une licence compatible avec l’usage commercial et une fenêtre de contexte de 262 100 tokens, adaptée aux traitements de documents longs ou aux flux de travail nécessitant beaucoup de contexte. À sa sortie, il se plaçait dans le top 78% des LLM de sa génération sur GPQA, ce qui le situe favorablement sur un benchmark de raisonnement scientifique. Son principal avantage reste économique : son tarif est très inférieur à celui des modèles haut de gamme et nettement sous la moyenne des LLM comparables.

Limites et points d'attention. Le score PinchBench agentique, mesuré sur OpenClaw avec 147 tâches, le place en retrait dans le classement disponible, ce qui invite à ne pas le présenter comme un modèle agentique de premier plan. La fiche repose sur 2 sources de données concordantes, un niveau de couverture utile mais limité. Le modèle apparaît surtout pertinent pour des usages recherchant un grand modèle open-weights, une longue fenêtre de contexte et un coût d’inférence contenu, plutôt qu’un maximum de performance agentique.

Sources des données : LLM-Stats (llm-stats.com) · PinchBench (pinchbench.com).

Mistral Large 3 (675B Instruct 2512)

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast