MiMo-V2-Flash

MiMo-V2-Flash est un LLM de Xiaomi sorti le 16 décembre 2025, publié en open-weights sous licence MIT avec usage commercial autorisé. Son positionnement combine un très grand format, 309 milliards de paramètres, une fenêtre de contexte de 262 144 tokens et une tarification très économique.

MiMo-V2-Flash est un LLM de Xiaomi sorti le 16 décembre 2025, publié en open-weights sous licence MIT avec usage commercial autorisé. Son positionnement combine un très grand format, 309 milliards de paramètres, une fenêtre de contexte de 262 144 tokens et une tarification très économique.

Le modèle se distingue surtout par son rapport prix-format : son tarif est indiqué 95% sous la moyenne des LLM similaires et environ 48.3 fois inférieur à celui des modèles frontière. Les données disponibles reposent sur quatre sources concordantes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurXiaomi
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie16 décembre 2025
Multimodalnon
Paramètres309 milliards
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text → text

Indices de synthèse

IndiceValeurRang (LLM)
Intelligence Index33.254ᵉ / 136

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
AIME 202594,1 %21ᵉ / 108llm-statsAuto-déclaré
Arena-Hard v286,2 %1ᵉ / 16llm-statsAuto-déclaré
MMLU-Pro84,9 %22ᵉ / 125llm-statsAuto-déclaré
HMMT 202584,4 %22ᵉ / 33llm-statsAuto-déclaré
GPQA83,7 %52ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench v680,6 %19ᵉ / 53llm-statsAuto-déclaré
Tau-bench80,3 %3ᵉ / 6llm-statsAuto-déclaré
SWE-Bench Verified73,4 %40ᵉ / 100llm-statsAuto-déclaré
SWE-bench Multilingual71,7 %13ᵉ / 32llm-statsAuto-déclaré
LongBench v260,6 %7ᵉ / 15llm-statsAuto-déclaré
BrowseComp58,3 %30ᵉ / 51llm-statsAuto-déclaré
MRCR45,7 %6ᵉ / 7llm-statsAuto-déclaré
Terminal-Bench 2.038,5 %45ᵉ / 48llm-statsAuto-déclaré
Terminal-Bench30,5 %19ᵉ / 25llm-statsAuto-déclaré
Humanity's Last Exam22,1 %49ᵉ / 86llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

Nemotron 3 Ultra 550B A…37.8
▶ MiMo-V2-Flash33.2
Mistral Medium 3.529.9

Classements Arena (Elo)

CatégorieEloRang
Arena Text1393130ᵉ
Arena Text1387137ᵉ
Arena Code133763ᵉ
Arena Code130170ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
artificialanalysis0,1 $0,3 $0,01 $

Prix en dollars US par million de tokens.

Sa tarification se situe 95 % en dessous de la moyenne des LLM similaires, et 48,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. MiMo-V2-Flash présente un profil intéressant pour un modèle open-weights de très grande taille, avec une fenêtre de contexte suffisamment large pour traiter de longs corpus en une seule requête. À sa sortie, il se situait dans le top 11% de sa génération sur GPQA, ce qui le plaçait dans le haut du panier des LLM sortis sur une période comparable. Son classement en Arena Code est nettement plus favorable que ses résultats en Arena text, ce qui suggère un positionnement relativement plus solide sur les évaluations liées au code que sur les préférences générales en texte. Son principal avantage opérationnel reste le coût, très inférieur à celui des modèles comparables et des modèles haut de gamme.

Limites et points d'attention. Malgré son format massif, MiMo-V2-Flash n’apparaît pas comme un modèle de tête dans les classements globaux : son Intelligence Index le place plutôt en milieu supérieur, tandis que ses résultats en Arena text sont faibles dans le classement disponible. La taille de 309 milliards de paramètres peut aussi peser sur les contraintes d’hébergement et d’inférence, même si la licence MIT facilite l’exploitation commerciale. Le modèle convient surtout aux usages recherchant un grand contexte, des coûts bas et des poids ouverts, plutôt qu’un niveau de performance maximal en conversation générale.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Arena.ai (arena.ai).