Mistral AI

Mistral Large 2407

Mistral Large 2407 est un LLM de Mistral AI sorti le 19 novembre 2024. Avec près de deux ans d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, à situer face aux modèles de sa période plutôt qu’aux systèmes les plus récents.

Le modèle se distingue surtout par une fenêtre de contexte de 131 072 tokens, un positionnement tarifaire économique et un profil Benchable très solide sur les hallucinations et la classification d’e-mails. Ses connaissances s’arrêtent au 31 mars 2024, ce qui limite son intérêt pour les usages dépendants de l’actualité récente.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Date de sortie	19 novembre 2024
Connaissances jusqu'à	2024-03-31
Multimodal	oui
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text,file → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Hallucinations (Baseline)	100,0 %	1ᵉ / 229	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	99,5 %	68ᵉ / 250	benchable	✅ Mesuré
Benchable : Ethics (Baseline)	99,0 %	114ᵉ / 248	benchable	✅ Mesuré
Benchable : Email Classification (Baseline)	99,0 %	24ᵉ / 254	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	88,0 %	120ᵉ / 217	benchable	✅ Mesuré
Benchable : Coding (Baseline)	82,0 %	162ᵉ / 248	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	62,0 %	128ᵉ / 252	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	58,0 %	167ᵉ / 239	benchable	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Hallucinations (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

gemini-3.1-flash-image100 %

Qwen2.5 72B Instruct100 %

▶ Mistral Large 2407100 %

Nemotron Nano 9B v298 %

Benchable : General Knowledge (Baseline)

Claude Opus 4100 %

Gemini 2.5 Flash100 %

GPT-5100 %

nemotron-nano-12b-v2-vl100 %

▶ Mistral Large 2407100 %

Llama 3.3 70B Instruct98 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
Mistral	2 $	6 $	0,2 $

Prix en dollars US par million de tokens.

Sa tarification se situe 3 % au-dessus de la moyenne des LLM similaires, et 2,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,07 $
Latence moyenne par benchmark — Benchable	3 min 01 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. À sa sortie, Mistral Large 2407 figurait dans le haut du panier de sa génération sur la maîtrise des hallucinations, avec un résultat Benchable placé tout en haut du classement sur Hallucinations (Baseline). Le modèle se montre aussi performant en Email Classification (Baseline), un signal utile pour les tâches de tri, routage ou catégorisation de messages. General Knowledge (Baseline) reste bien positionné, ce qui indique une base généraliste solide pour son époque. Son grand contexte de 131 072 tokens lui donne un avantage sur les entrées longues. Côté prix, son positionnement reste économique, avec un tarif proche de la moyenne des LLM similaires et nettement inférieur à celui des modèles frontière.

Limites et points d'attention. L’ancienneté est le principal frein : près de deux ans représentent un cycle très long dans l’IA générative, et ce modèle est probablement largement dépassé par les modèles actuels, voire souvent absent des catalogues récents de l’éditeur. Ses connaissances s’arrêtent au 31 mars 2024, ce qui impose une vigilance sur les faits postérieurs. Les résultats Benchable en Mathematics (Baseline) et surtout en Coding (Baseline) le placent plutôt en milieu ou bas de tableau selon les comparaisons, loin des meilleurs profils spécialisés. Le très bon score en hallucinations ne suffit donc pas à en faire un choix moderne pour le raisonnement, le code ou les usages exigeant l’état de l’art.

Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).

Mistral Large 2407

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast