Mistral Large 2407

Mistral Large 2407 est un LLM de Mistral AI sorti le 19 novembre 2024. Avec près de deux ans d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, à situer face aux modèles de sa période plutôt qu’aux systèmes les plus récents.

Mistral Large 2407 est un LLM de Mistral AI sorti le 19 novembre 2024. Avec près de deux ans d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, à situer face aux modèles de sa période plutôt qu’aux systèmes les plus récents.

Le modèle se distingue surtout par une fenêtre de contexte de 131 072 tokens, un positionnement tarifaire économique et un profil Benchable très solide sur les hallucinations et la classification d’e-mails. Ses connaissances s’arrêtent au 31 mars 2024, ce qui limite son intérêt pour les usages dépendants de l’actualité récente.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMistral AI
Date de sortie19 novembre 2024
Connaissances jusqu'à2024-03-31
Multimodaloui
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text,file → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Hallucinations (Baseline)100,0 %1ᵉ / 229benchable✅ Mesuré
Benchable : General Knowledge (Baseline)99,5 %68ᵉ / 250benchable✅ Mesuré
Benchable : Ethics (Baseline)99,0 %114ᵉ / 248benchable✅ Mesuré
Benchable : Email Classification (Baseline)99,0 %24ᵉ / 254benchable✅ Mesuré
Benchable : Mathematics (Baseline)88,0 %120ᵉ / 217benchable✅ Mesuré
Benchable : Coding (Baseline)82,0 %162ᵉ / 248benchable✅ Mesuré
Benchable : Instruction Following (Baseline)62,0 %128ᵉ / 252benchable✅ Mesuré
Benchable : Reasoning (Baseline)58,0 %167ᵉ / 239benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Hallucinations (Baseline)

Qwen2.5 72B Instruct100 %
▶ Mistral Large 2407100 %
Nemotron Nano 9B v298 %

Benchable : General Knowledge (Baseline)

GPT-5100 %
nemotron-nano-12b-v2-vl100 %
▶ Mistral Large 2407100 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Mistral2 $6 $0,2 $

Prix en dollars US par million de tokens.

Sa tarification se situe 3 % au-dessus de la moyenne des LLM similaires, et 2,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,07 $
Latence moyenne par benchmark — Benchable3 min 01 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. À sa sortie, Mistral Large 2407 figurait dans le haut du panier de sa génération sur la maîtrise des hallucinations, avec un résultat Benchable placé tout en haut du classement sur Hallucinations (Baseline). Le modèle se montre aussi performant en Email Classification (Baseline), un signal utile pour les tâches de tri, routage ou catégorisation de messages. General Knowledge (Baseline) reste bien positionné, ce qui indique une base généraliste solide pour son époque. Son grand contexte de 131 072 tokens lui donne un avantage sur les entrées longues. Côté prix, son positionnement reste économique, avec un tarif proche de la moyenne des LLM similaires et nettement inférieur à celui des modèles frontière.

Limites et points d'attention. L’ancienneté est le principal frein : près de deux ans représentent un cycle très long dans l’IA générative, et ce modèle est probablement largement dépassé par les modèles actuels, voire souvent absent des catalogues récents de l’éditeur. Ses connaissances s’arrêtent au 31 mars 2024, ce qui impose une vigilance sur les faits postérieurs. Les résultats Benchable en Mathematics (Baseline) et surtout en Coding (Baseline) le placent plutôt en milieu ou bas de tableau selon les comparaisons, loin des meilleurs profils spécialisés. Le très bon score en hallucinations ne suffit donc pas à en faire un choix moderne pour le raisonnement, le code ou les usages exigeant l’état de l’art.


Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).