MiMo-V2-Pro
MiMo-V2-Pro est un LLM propriétaire de Xiaomi, publié le 18 mars 2026, avec des poids non ouverts. Le modèle se distingue surtout par son échelle, 1000 milliards de paramètres, et par une fenêtre de contexte d’environ 1,0 M de tokens, adaptée aux entrées très longues.
MiMo-V2-Pro est un LLM propriétaire de Xiaomi, publié le 18 mars 2026, avec des poids non ouverts. Le modèle se distingue surtout par son échelle, 1000 milliards de paramètres, et par une fenêtre de contexte d’environ 1,0 M de tokens, adaptée aux entrées très longues.
À sa sortie, MiMo-V2-Pro se situait dans le top 11% des LLM de sa génération sur SWE-Bench Verified, un signal notable pour les tâches de correction logicielle. Ses résultats publics reposent sur 4 sources de données concordantes.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Xiaomi |
| Licence | Proprietary (poids non ouverts) |
| Date de sortie | 18 mars 2026 |
| Multimodal | non |
| Paramètres | 1000 milliards |
| Fenêtre de contexte | 1 048 576 tokens (≈ 1,0 M) |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| LiveBench: Mathematics | 77,0 % | 44ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Reasoning | 69,7 % | 39ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Language | 69,1 % | 47ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Coding | 68,8 % | 51ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Global average | 58,1 % | 50ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Data Analysis | 49,2 % | 55ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: IF | 43,2 % | 48ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Agentic Coding | 30,0 % | 59ᵉ / 76 | livebench | ✅ Mesuré |
| Tau2 Telecom | 96,8 % | 8ᵉ / 34 | llm-stats | Auto-déclaré |
| DeepSearchQA | 86,7 % | 3ᵉ / 6 | llm-stats | Auto-déclaré |
| PinchBench | 81,0 % | 3ᵉ / 4 | llm-stats | Auto-déclaré |
| SWE-Bench Verified | 78,0 % | 18ᵉ / 100 | llm-stats | Auto-déclaré |
| SWE-bench Multilingual | 71,7 % | 13ᵉ / 32 | llm-stats | Auto-déclaré |
| Claw-Eval | 61,5 % | 8ᵉ / 12 | llm-stats | Auto-déclaré |
| Terminal-Bench 2.0 | 57,1 % | 24ᵉ / 48 | llm-stats | Auto-déclaré |
| GDPval-AA | 47,5 % | 7ᵉ / 33 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
LiveBench: Mathematics
LiveBench: Reasoning
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1448 | 50ᵉ |
| Arena Code | 1432 | 33ᵉ |
Notre analyse
Forces. MiMo-V2-Pro affiche ses meilleurs signaux en mathématiques et en raisonnement sur LiveBench, deux domaines où il se place dans le milieu supérieur de son groupe de comparaison sans atteindre les tout premiers rangs. Son classement Arena code est plus favorable que son classement Arena text, ce qui confirme un profil relativement solide sur les tâches de programmation. Le résultat sur SWE-Bench Verified est le point le plus marquant à sa sortie, avec une position dans le haut du panier des LLM publiés dans les 18 mois précédents. Sa très grande fenêtre de contexte constitue aussi un avantage concret pour traiter de longs dépôts, documents ou historiques de conversation.
Limites et points d'attention. Malgré son échelle, MiMo-V2-Pro reste en milieu de tableau sur la moyenne globale LiveBench. Les résultats en compréhension du langage et en programmation y sont corrects mais pas dominants, tandis que l’analyse de données apparaît comme le point faible le plus net. La licence propriétaire limite l’audit, l’auto-hébergement et l’adaptation fine par rapport à des modèles à poids ouverts. Le positionnement général correspond à un grand modèle fermé, compétitif sur certains usages techniques, mais moins convaincant comme référence généraliste haut de gamme.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai).