MiMo-V2-Pro

MiMo-V2-Pro est un LLM propriétaire de Xiaomi, publié le 18 mars 2026, avec des poids non ouverts. Le modèle se distingue surtout par son échelle, 1000 milliards de paramètres, et par une fenêtre de contexte d’environ 1,0 M de tokens, adaptée aux entrées très longues.

MiMo-V2-Pro est un LLM propriétaire de Xiaomi, publié le 18 mars 2026, avec des poids non ouverts. Le modèle se distingue surtout par son échelle, 1000 milliards de paramètres, et par une fenêtre de contexte d’environ 1,0 M de tokens, adaptée aux entrées très longues.

À sa sortie, MiMo-V2-Pro se situait dans le top 11% des LLM de sa génération sur SWE-Bench Verified, un signal notable pour les tâches de correction logicielle. Ses résultats publics reposent sur 4 sources de données concordantes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurXiaomi
LicenceProprietary (poids non ouverts)
Date de sortie18 mars 2026
Multimodalnon
Paramètres1000 milliards
Fenêtre de contexte1 048 576 tokens (≈ 1,0 M)
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
LiveBench: Mathematics77,0 %44ᵉ / 76livebench✅ Mesuré
LiveBench: Reasoning69,7 %39ᵉ / 76livebench✅ Mesuré
LiveBench: Language69,1 %47ᵉ / 76livebench✅ Mesuré
LiveBench: Coding68,8 %51ᵉ / 76livebench✅ Mesuré
LiveBench: Global average58,1 %50ᵉ / 76livebench✅ Mesuré
LiveBench: Data Analysis49,2 %55ᵉ / 76livebench✅ Mesuré
LiveBench: IF43,2 %48ᵉ / 76livebench✅ Mesuré
LiveBench: Agentic Coding30,0 %59ᵉ / 76livebench✅ Mesuré
Tau2 Telecom96,8 %8ᵉ / 34llm-statsAuto-déclaré
DeepSearchQA86,7 %3ᵉ / 6llm-statsAuto-déclaré
PinchBench81,0 %3ᵉ / 4llm-statsAuto-déclaré
SWE-Bench Verified78,0 %18ᵉ / 100llm-statsAuto-déclaré
SWE-bench Multilingual71,7 %13ᵉ / 32llm-statsAuto-déclaré
Claw-Eval61,5 %8ᵉ / 12llm-statsAuto-déclaré
Terminal-Bench 2.057,1 %24ᵉ / 48llm-statsAuto-déclaré
GDPval-AA47,5 %7ᵉ / 33llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

LiveBench: Mathematics

Qwen3.7 Max85 %
▶ MiMo-V2-Pro77 %
Nemotron 3 Ultra55 %

LiveBench: Reasoning

▶ MiMo-V2-Pro70 %
Nemotron 3 Ultra38 %

Classements Arena (Elo)

CatégorieEloRang
Arena Text144850ᵉ
Arena Code143233ᵉ

Notre analyse

Forces. MiMo-V2-Pro affiche ses meilleurs signaux en mathématiques et en raisonnement sur LiveBench, deux domaines où il se place dans le milieu supérieur de son groupe de comparaison sans atteindre les tout premiers rangs. Son classement Arena code est plus favorable que son classement Arena text, ce qui confirme un profil relativement solide sur les tâches de programmation. Le résultat sur SWE-Bench Verified est le point le plus marquant à sa sortie, avec une position dans le haut du panier des LLM publiés dans les 18 mois précédents. Sa très grande fenêtre de contexte constitue aussi un avantage concret pour traiter de longs dépôts, documents ou historiques de conversation.

Limites et points d'attention. Malgré son échelle, MiMo-V2-Pro reste en milieu de tableau sur la moyenne globale LiveBench. Les résultats en compréhension du langage et en programmation y sont corrects mais pas dominants, tandis que l’analyse de données apparaît comme le point faible le plus net. La licence propriétaire limite l’audit, l’auto-hébergement et l’adaptation fine par rapport à des modèles à poids ouverts. Le positionnement général correspond à un grand modèle fermé, compétitif sur certains usages techniques, mais moins convaincant comme référence généraliste haut de gamme.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai).