Xiaomi

MiMo-V2-Pro

MiMo-V2-Pro est un LLM propriétaire de Xiaomi, publié le 18 mars 2026, avec des poids non ouverts. Le modèle se distingue surtout par son échelle, 1000 milliards de paramètres, et par une fenêtre de contexte d’environ 1,0 M de tokens, adaptée aux entrées très longues.

À sa sortie, MiMo-V2-Pro se situait dans le top 11% des LLM de sa génération sur SWE-Bench Verified, un signal notable pour les tâches de correction logicielle. Ses résultats publics reposent sur 4 sources de données concordantes.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Xiaomi
Licence	Proprietary (poids non ouverts)
Date de sortie	18 mars 2026
Multimodal	non
Paramètres	1000 milliards
Fenêtre de contexte	1 048 576 tokens (≈ 1,0 M)
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
LiveBench: Mathematics	77,0 %	44ᵉ / 76	livebench	✅ Mesuré
LiveBench: Reasoning	69,7 %	39ᵉ / 76	livebench	✅ Mesuré
LiveBench: Language	69,1 %	47ᵉ / 76	livebench	✅ Mesuré
LiveBench: Coding	68,8 %	51ᵉ / 76	livebench	✅ Mesuré
LiveBench: Global average	58,1 %	50ᵉ / 76	livebench	✅ Mesuré
LiveBench: Data Analysis	49,2 %	55ᵉ / 76	livebench	✅ Mesuré
LiveBench: IF	43,2 %	48ᵉ / 76	livebench	✅ Mesuré
LiveBench: Agentic Coding	30,0 %	59ᵉ / 76	livebench	✅ Mesuré
Tau2 Telecom	96,8 %	8ᵉ / 34	llm-stats	Auto-déclaré
DeepSearchQA	86,7 %	3ᵉ / 6	llm-stats	Auto-déclaré
PinchBench	81,0 %	3ᵉ / 4	llm-stats	Auto-déclaré
SWE-Bench Verified	78,0 %	18ᵉ / 100	llm-stats	Auto-déclaré
SWE-bench Multilingual	71,7 %	13ᵉ / 32	llm-stats	Auto-déclaré
Claw-Eval	61,5 %	8ᵉ / 12	llm-stats	Auto-déclaré
Terminal-Bench 2.0	57,1 %	24ᵉ / 48	llm-stats	Auto-déclaré
GDPval-AA	47,5 %	7ᵉ / 33	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

LiveBench: Mathematics

GPT-5.596 %

Claude Opus 4.895 %

Gemini 3.1 Pro Preview91 %

Qwen3.7 Max85 %

▶ MiMo-V2-Pro77 %

Nemotron 3 Ultra55 %

LiveBench: Reasoning

Claude Opus 4.890 %

GPT-5.488 %

Gemini 3.1 Pro Preview84 %

Grok 4.1 Fast80 %

▶ MiMo-V2-Pro70 %

Nemotron 3 Ultra38 %

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1448	50ᵉ
Arena Code	1432	33ᵉ

Notre analyse

Forces. MiMo-V2-Pro affiche ses meilleurs signaux en mathématiques et en raisonnement sur LiveBench, deux domaines où il se place dans le milieu supérieur de son groupe de comparaison sans atteindre les tout premiers rangs. Son classement Arena code est plus favorable que son classement Arena text, ce qui confirme un profil relativement solide sur les tâches de programmation. Le résultat sur SWE-Bench Verified est le point le plus marquant à sa sortie, avec une position dans le haut du panier des LLM publiés dans les 18 mois précédents. Sa très grande fenêtre de contexte constitue aussi un avantage concret pour traiter de longs dépôts, documents ou historiques de conversation.

Limites et points d'attention. Malgré son échelle, MiMo-V2-Pro reste en milieu de tableau sur la moyenne globale LiveBench. Les résultats en compréhension du langage et en programmation y sont corrects mais pas dominants, tandis que l’analyse de données apparaît comme le point faible le plus net. La licence propriétaire limite l’audit, l’auto-hébergement et l’adaptation fine par rapport à des modèles à poids ouverts. Le positionnement général correspond à un grand modèle fermé, compétitif sur certains usages techniques, mais moins convaincant comme référence généraliste haut de gamme.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai).

MiMo-V2-Pro

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Classements Arena (Elo)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast