Mistral Large 2407
Mistral Large 2407 est un LLM de Mistral AI sorti le 19 novembre 2024. Avec près de deux ans d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, à situer face aux modèles de sa période plutôt qu’aux systèmes les plus récents.
Mistral Large 2407 est un LLM de Mistral AI sorti le 19 novembre 2024. Avec près de deux ans d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, à situer face aux modèles de sa période plutôt qu’aux systèmes les plus récents.
Le modèle se distingue surtout par une fenêtre de contexte de 131 072 tokens, un positionnement tarifaire économique et un profil Benchable très solide sur les hallucinations et la classification d’e-mails. Ses connaissances s’arrêtent au 31 mars 2024, ce qui limite son intérêt pour les usages dépendants de l’actualité récente.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Date de sortie | 19 novembre 2024 |
| Connaissances jusqu'à | 2024-03-31 |
| Multimodal | oui |
| Fenêtre de contexte | 131 072 tokens |
| Modalités (entrée → sortie) | text,file → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : Hallucinations (Baseline) | 100,0 % | 1ᵉ / 229 | benchable | ✅ Mesuré |
| Benchable : General Knowledge (Baseline) | 99,5 % | 68ᵉ / 250 | benchable | ✅ Mesuré |
| Benchable : Ethics (Baseline) | 99,0 % | 114ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Email Classification (Baseline) | 99,0 % | 24ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : Mathematics (Baseline) | 88,0 % | 120ᵉ / 217 | benchable | ✅ Mesuré |
| Benchable : Coding (Baseline) | 82,0 % | 162ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 62,0 % | 128ᵉ / 252 | benchable | ✅ Mesuré |
| Benchable : Reasoning (Baseline) | 58,0 % | 167ᵉ / 239 | benchable | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Benchable : Hallucinations (Baseline)
Benchable : General Knowledge (Baseline)
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Mistral | 2 $ | 6 $ | 0,2 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 3 % au-dessus de la moyenne des LLM similaires, et 2,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0,07 $ |
| Latence moyenne par benchmark — Benchable | 3 min 01 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. À sa sortie, Mistral Large 2407 figurait dans le haut du panier de sa génération sur la maîtrise des hallucinations, avec un résultat Benchable placé tout en haut du classement sur Hallucinations (Baseline). Le modèle se montre aussi performant en Email Classification (Baseline), un signal utile pour les tâches de tri, routage ou catégorisation de messages. General Knowledge (Baseline) reste bien positionné, ce qui indique une base généraliste solide pour son époque. Son grand contexte de 131 072 tokens lui donne un avantage sur les entrées longues. Côté prix, son positionnement reste économique, avec un tarif proche de la moyenne des LLM similaires et nettement inférieur à celui des modèles frontière.
Limites et points d'attention. L’ancienneté est le principal frein : près de deux ans représentent un cycle très long dans l’IA générative, et ce modèle est probablement largement dépassé par les modèles actuels, voire souvent absent des catalogues récents de l’éditeur. Ses connaissances s’arrêtent au 31 mars 2024, ce qui impose une vigilance sur les faits postérieurs. Les résultats Benchable en Mathematics (Baseline) et surtout en Coding (Baseline) le placent plutôt en milieu ou bas de tableau selon les comparaisons, loin des meilleurs profils spécialisés. Le très bon score en hallucinations ne suffit donc pas à en faire un choix moderne pour le raisonnement, le code ou les usages exigeant l’état de l’art.
Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).