MiniMax M1
MiniMax M1 est un LLM publié par MiniMax le 17 juin 2025. Avec environ un an d’ancienneté, il appartient déjà à une génération longue à l’échelle de l’IA, à comparer surtout aux modèles sortis autour de sa période plutôt qu’aux systèmes les plus récents.
MiniMax M1 est un LLM publié par MiniMax le 17 juin 2025. Avec environ un an d’ancienneté, il appartient déjà à une génération longue à l’échelle de l’IA, à comparer surtout aux modèles sortis autour de sa période plutôt qu’aux systèmes les plus récents.
Son trait le plus visible est une très grande fenêtre de contexte de 1 000 000 tokens, associée à un positionnement tarifaire très économique. Son prix se situe nettement sous la moyenne des LLM similaires et environ 12,1 fois sous celui des modèles frontière, ce qui en faisait un modèle agressif sur le coût à sa sortie.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | MiniMax |
| Date de sortie | 17 juin 2025 |
| Connaissances jusqu'à | 2024-06-30 |
| Multimodal | non |
| Fenêtre de contexte | 1 000 000 tokens (≈ 1,0 M) |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : Email Classification (Baseline) | 100,0 % | 1ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : General Knowledge (Baseline) | 99,8 % | 63ᵉ / 250 | benchable | ✅ Mesuré |
| Benchable : Ethics (Baseline) | 99,0 % | 114ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Reasoning (Baseline) | 93,9 % | 75ᵉ / 239 | benchable | ✅ Mesuré |
| Benchable : Coding (Baseline) | 91,0 % | 98ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Hallucinations (Baseline) | 89,8 % | 156ᵉ / 229 | benchable | ✅ Mesuré |
| Benchable : Mathematics (Baseline) | 87,5 % | 123ᵉ / 217 | benchable | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 62,6 % | 127ᵉ / 252 | benchable | ✅ Mesuré |
| MATH-500 | 96,0 % | 15ᵉ / 31 | llm-stats | Auto-déclaré |
| AIME 2024 | 83,3 % | 19ᵉ / 52 | llm-stats | Auto-déclaré |
| MMLU-Pro | 80,6 % | 49ᵉ / 125 | llm-stats | Auto-déclaré |
| ZebraLogic | 80,1 % | 7ᵉ / 7 | llm-stats | Auto-déclaré |
| OpenAI-MRCR: 2 needle 128k | 76,1 % | 2ᵉ / 8 | llm-stats | Auto-déclaré |
| AIME 2025 | 74,6 % | 74ᵉ / 108 | llm-stats | Auto-déclaré |
| GPQA | 69,2 % | 115ᵉ / 213 | llm-stats | Auto-déclaré |
| TAU-bench Retail | 67,8 % | 15ᵉ / 24 | llm-stats | Auto-déclaré |
| LiveCodeBench | 62,3 % | 31ᵉ / 72 | llm-stats | Auto-déclaré |
| LongBench v2 | 61,0 % | 4ᵉ / 15 | llm-stats | Auto-déclaré |
| TAU-bench Airline | 60,0 % | 4ᵉ / 22 | llm-stats | Auto-déclaré |
| OpenAI-MRCR: 2 needle 1M | 58,6 % | 1ᵉ / 4 | llm-stats | Auto-déclaré |
| SWE-Bench Verified | 55,6 % | 79ᵉ / 100 | llm-stats | Auto-déclaré |
| Multi-Challenge | 44,7 % | 18ᵉ / 28 | llm-stats | Auto-déclaré |
| SimpleQA | 17,9 % | 35ᵉ / 45 | llm-stats | Auto-déclaré |
| Humanity's Last Exam | 7,2 % | 79ᵉ / 86 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Benchable : Email Classification (Baseline)
Benchable : General Knowledge (Baseline)
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1364 | 159ᵉ |
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| MiniMax | 0,4 $ | 2,2 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 79 % en dessous de la moyenne des LLM similaires, et 12,1 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0,23 $ |
| Latence moyenne par benchmark — Benchable | 2 h 20 min |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. MiniMax M1 se distingue d’abord par ses résultats Benchable solides sur les tâches structurées. Email Classification (Baseline) le place dans le top 10, ce qui indique une très bonne fiabilité sur le tri et l’interprétation de messages. General Knowledge (Baseline) atteint aussi un niveau maximal dans le score publié, tandis que Reasoning (Baseline) et Coding (Baseline) restent à des niveaux élevés pour un modèle de sa génération. À sa sortie, il figurait dans le top 26% sur GPQA parmi les LLM comparables lancés dans les 18 mois précédents, ce qui le situait dans le haut du panier de son époque. Sa fenêtre de contexte très large renforçait son intérêt pour l’analyse de longs documents ou de corpus volumineux.
Limites et points d'attention. MiniMax M1 est un modèle ancien au rythme actuel du secteur. Ses performances sont probablement largement dépassées par des LLM plus récents, et ce type de modèle est souvent retiré ou remplacé dans les catalogues éditeurs. Son classement Arena text reste modeste, signe d’une compétitivité limitée en préférence utilisateur face à un large panel de modèles. Le résultat Hallucinations (Baseline), malgré un score élevé en valeur absolue, se situe plutôt bas dans le classement, ce qui invite à ne pas le considérer comme un modèle de référence pour les réponses factuelles sensibles. Sa connaissance s’arrête au 30 juin 2024, un point bloquant pour les sujets récents.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Benchable.ai (benchable.ai).