Mistral Large 3 (675B Base)
Mistral Large 3 (675B Base) est un LLM de Mistral AI publié le 4 décembre 2025, avec 675 milliards de paramètres. Son positionnement tient surtout à son format open-weights sous licence Apache 2.0, qui autorise les usages commerciaux.
Mistral Large 3 (675B Base) est un LLM de Mistral AI publié le 4 décembre 2025, avec 675 milliards de paramètres. Son positionnement tient surtout à son format open-weights sous licence Apache 2.0, qui autorise les usages commerciaux.
À sa sortie, le modèle se situait dans sa génération sur GPQA parmi 147 LLM évalués sur une fenêtre de ±9 mois. La fiche repose sur une source de données concordante, un niveau de couverture à garder en tête pour interpréter son profil.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 4 décembre 2025 |
| Multimodal | oui |
| Paramètres | 675 milliards |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MMMLU | 85,5 % | 28ᵉ / 49 | llm-stats | Auto-déclaré |
| AMC_2022_23 | 52,0 % | 1ᵉ / 6 | llm-stats | Auto-déclaré |
| GPQA | 43,9 % | 172ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench | 34,4 % | 53ᵉ / 72 | llm-stats | Auto-déclaré |
| SimpleQA | 23,8 % | 30ᵉ / 45 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Mistral Large 3 (675B Base) combine une très grande échelle, 675 milliards de paramètres, avec une licence Apache 2.0, un choix notable pour un modèle open-weights exploitable commercialement. À sa sortie, son classement GPQA le plaçait dans le top 78% des LLM de sa génération, sur un échantillon de 147 modèles comparables dans le temps. Ce résultat indique une présence mesurable dans le paysage des grands modèles de fin 2025, même si le score ne le situe pas dans le tout premier groupe.
Limites et points d'attention. Le seul repère de performance disponible ici est GPQA, sans autres indices publics fournis pour le code, les agents, les mathématiques ou l'usage général. La couverture repose sur une source concordante, ce qui limite la solidité des comparaisons fines. Son rang à la sortie reste inférieur au haut du panier des modèles de sa période. Le profil convient surtout à l'analyse d'un très grand modèle open-weights de Mistral AI sous licence commerciale permissive.
Sources des données : LLM-Stats (llm-stats.com).