MiniMax

MiniMax M1

MiniMax M1 est un LLM publié par MiniMax le 17 juin 2025. Avec environ un an d’ancienneté, il appartient déjà à une génération longue à l’échelle de l’IA, à comparer surtout aux modèles sortis autour de sa période plutôt qu’aux systèmes les plus récents.

Son trait le plus visible est une très grande fenêtre de contexte de 1 000 000 tokens, associée à un positionnement tarifaire très économique. Son prix se situe nettement sous la moyenne des LLM similaires et environ 12,1 fois sous celui des modèles frontière, ce qui en faisait un modèle agressif sur le coût à sa sortie.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	MiniMax
Date de sortie	17 juin 2025
Connaissances jusqu'à	2024-06-30
Multimodal	non
Fenêtre de contexte	1 000 000 tokens (≈ 1,0 M)
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Email Classification (Baseline)	100,0 %	1ᵉ / 254	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	99,8 %	63ᵉ / 250	benchable	✅ Mesuré
Benchable : Ethics (Baseline)	99,0 %	114ᵉ / 248	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	93,9 %	75ᵉ / 239	benchable	✅ Mesuré
Benchable : Coding (Baseline)	91,0 %	98ᵉ / 248	benchable	✅ Mesuré
Benchable : Hallucinations (Baseline)	89,8 %	156ᵉ / 229	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	87,5 %	123ᵉ / 217	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	62,6 %	127ᵉ / 252	benchable	✅ Mesuré
MATH-500	96,0 %	15ᵉ / 31	llm-stats	Auto-déclaré
AIME 2024	83,3 %	19ᵉ / 52	llm-stats	Auto-déclaré
MMLU-Pro	80,6 %	49ᵉ / 125	llm-stats	Auto-déclaré
ZebraLogic	80,1 %	7ᵉ / 7	llm-stats	Auto-déclaré
OpenAI-MRCR: 2 needle 128k	76,1 %	2ᵉ / 8	llm-stats	Auto-déclaré
AIME 2025	74,6 %	74ᵉ / 108	llm-stats	Auto-déclaré
GPQA	69,2 %	115ᵉ / 213	llm-stats	Auto-déclaré
TAU-bench Retail	67,8 %	15ᵉ / 24	llm-stats	Auto-déclaré
LiveCodeBench	62,3 %	31ᵉ / 72	llm-stats	Auto-déclaré
LongBench v2	61,0 %	4ᵉ / 15	llm-stats	Auto-déclaré
TAU-bench Airline	60,0 %	4ᵉ / 22	llm-stats	Auto-déclaré
OpenAI-MRCR: 2 needle 1M	58,6 %	1ᵉ / 4	llm-stats	Auto-déclaré
SWE-Bench Verified	55,6 %	79ᵉ / 100	llm-stats	Auto-déclaré
Multi-Challenge	44,7 %	18ᵉ / 28	llm-stats	Auto-déclaré
SimpleQA	17,9 %	35ᵉ / 45	llm-stats	Auto-déclaré
Humanity's Last Exam	7,2 %	79ᵉ / 86	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Email Classification (Baseline)

DeepSeek-R1100 %

Gemini 2.5 Flash-Lite100 %

GPT-4 Turbo100 %

Qwen 3.5 Plus100 %

▶ MiniMax M1100 %

Claude Sonnet 499 %

Benchable : General Knowledge (Baseline)

Claude Opus 4100 %

Gemini 2.5 Flash100 %

GPT-5100 %

DeepSeek R1 Distill Lla…100 %

▶ MiniMax M1100 %

nemotron-nano-12b-v2-vl100 %

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1364	159ᵉ

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
MiniMax	0,4 $	2,2 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 79 % en dessous de la moyenne des LLM similaires, et 12,1 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,23 $
Latence moyenne par benchmark — Benchable	2 h 20 min

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. MiniMax M1 se distingue d’abord par ses résultats Benchable solides sur les tâches structurées. Email Classification (Baseline) le place dans le top 10, ce qui indique une très bonne fiabilité sur le tri et l’interprétation de messages. General Knowledge (Baseline) atteint aussi un niveau maximal dans le score publié, tandis que Reasoning (Baseline) et Coding (Baseline) restent à des niveaux élevés pour un modèle de sa génération. À sa sortie, il figurait dans le top 26% sur GPQA parmi les LLM comparables lancés dans les 18 mois précédents, ce qui le situait dans le haut du panier de son époque. Sa fenêtre de contexte très large renforçait son intérêt pour l’analyse de longs documents ou de corpus volumineux.

Limites et points d'attention. MiniMax M1 est un modèle ancien au rythme actuel du secteur. Ses performances sont probablement largement dépassées par des LLM plus récents, et ce type de modèle est souvent retiré ou remplacé dans les catalogues éditeurs. Son classement Arena text reste modeste, signe d’une compétitivité limitée en préférence utilisateur face à un large panel de modèles. Le résultat Hallucinations (Baseline), malgré un score élevé en valeur absolue, se situe plutôt bas dans le classement, ce qui invite à ne pas le considérer comme un modèle de référence pour les réponses factuelles sensibles. Sa connaissance s’arrête au 30 juin 2024, un point bloquant pour les sujets récents.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Benchable.ai (benchable.ai).

MiniMax M1

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Classements Arena (Elo)

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast