Mistral Large 3 (675B Instruct 2512)
Mistral Large 3 (675B Instruct 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine un très grand nombre de paramètres, une fenêtre de contexte très étendue et une tarification…
Mistral Large 3 (675B Instruct 2512) est un LLM de Mistral AI publié le 4 décembre 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine un très grand nombre de paramètres, une fenêtre de contexte très étendue et une tarification très basse pour sa catégorie.
Le modèle se distingue surtout par son rapport coût-format : il est annoncé 74% moins cher que la moyenne des LLM similaires et environ 9,7 fois moins cher que les modèles frontière. Cette fiche le situe donc autant comme grand modèle open-weights que comme option économique à grande fenêtre de contexte.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 4 décembre 2025 |
| Multimodal | oui |
| Paramètres | 675 milliards |
| Fenêtre de contexte | 262 100 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| PinchBench : agentique (OpenClaw, 147 tâches) | 54,5 % | 41ᵉ / 52 | pinchbench | ✅ Mesuré |
| MMMLU | 85,5 % | 28ᵉ / 49 | llm-stats | Auto-déclaré |
| AMC_2022_23 | 52,0 % | 1ᵉ / 6 | llm-stats | Auto-déclaré |
| GPQA | 43,9 % | 172ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench | 34,4 % | 53ᵉ / 72 | llm-stats | Auto-déclaré |
| SimpleQA | 23,8 % | 30ᵉ / 45 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
PinchBench : agentique (OpenClaw, 147 tâches)
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| mistral | 0,5 $ | 1,5 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 74 % en dessous de la moyenne des LLM similaires, et 9,7 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût par exécution agentique — PinchBench (147 tâches) | 6,56 $ |
| Durée d'exécution — PinchBench | 4 h 25 min |
| Indice valeur/coût — PinchBench | 152,37 |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. Mistral Large 3 (675B Instruct 2512) réunit trois atouts concrets : des poids ouverts sous Apache 2.0, une licence compatible avec l’usage commercial et une fenêtre de contexte de 262 100 tokens, adaptée aux traitements de documents longs ou aux flux de travail nécessitant beaucoup de contexte. À sa sortie, il se plaçait dans le top 78% des LLM de sa génération sur GPQA, ce qui le situe favorablement sur un benchmark de raisonnement scientifique. Son principal avantage reste économique : son tarif est très inférieur à celui des modèles haut de gamme et nettement sous la moyenne des LLM comparables.
Limites et points d'attention. Le score PinchBench agentique, mesuré sur OpenClaw avec 147 tâches, le place en retrait dans le classement disponible, ce qui invite à ne pas le présenter comme un modèle agentique de premier plan. La fiche repose sur 2 sources de données concordantes, un niveau de couverture utile mais limité. Le modèle apparaît surtout pertinent pour des usages recherchant un grand modèle open-weights, une longue fenêtre de contexte et un coût d’inférence contenu, plutôt qu’un maximum de performance agentique.
Sources des données : LLM-Stats (llm-stats.com) · PinchBench (pinchbench.com).