Xiaomi

MiMo-V2-Flash

MiMo-V2-Flash est un LLM de Xiaomi sorti le 16 décembre 2025, publié en open-weights sous licence MIT avec usage commercial autorisé. Son positionnement combine un très grand format, 309 milliards de paramètres, une fenêtre de contexte de 262 144 tokens et une tarification très économique.

Le modèle se distingue surtout par son rapport prix-format : son tarif est indiqué 95% sous la moyenne des LLM similaires et environ 48.3 fois inférieur à celui des modèles frontière. Les données disponibles reposent sur quatre sources concordantes.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Xiaomi
Licence	MIT (open-weights, usage commercial autorisé)
Date de sortie	16 décembre 2025
Multimodal	non
Paramètres	309 milliards
Fenêtre de contexte	262 144 tokens
Modalités (entrée → sortie)	text → text

Indices de synthèse

Indice	Valeur	Rang (LLM)
Intelligence Index	33.2	54ᵉ / 136

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
AIME 2025	94,1 %	21ᵉ / 108	llm-stats	Auto-déclaré
Arena-Hard v2	86,2 %	1ᵉ / 16	llm-stats	Auto-déclaré
MMLU-Pro	84,9 %	22ᵉ / 125	llm-stats	Auto-déclaré
HMMT 2025	84,4 %	22ᵉ / 33	llm-stats	Auto-déclaré
GPQA	83,7 %	52ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench v6	80,6 %	19ᵉ / 53	llm-stats	Auto-déclaré
Tau-bench	80,3 %	3ᵉ / 6	llm-stats	Auto-déclaré
SWE-Bench Verified	73,4 %	40ᵉ / 100	llm-stats	Auto-déclaré
SWE-bench Multilingual	71,7 %	13ᵉ / 32	llm-stats	Auto-déclaré
LongBench v2	60,6 %	7ᵉ / 15	llm-stats	Auto-déclaré
BrowseComp	58,3 %	30ᵉ / 51	llm-stats	Auto-déclaré
MRCR	45,7 %	6ᵉ / 7	llm-stats	Auto-déclaré
Terminal-Bench 2.0	38,5 %	45ᵉ / 48	llm-stats	Auto-déclaré
Terminal-Bench	30,5 %	19ᵉ / 25	llm-stats	Auto-déclaré
Humanity's Last Exam	22,1 %	49ᵉ / 86	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

Claude Fable 559.9

GPT-5.451.4

Gemini 3.1 Pro Preview46.5

Nemotron 3 Ultra 550B A…37.8

▶ MiMo-V2-Flash33.2

Mistral Medium 3.529.9

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1393	130ᵉ
Arena Text	1387	137ᵉ
Arena Code	1337	63ᵉ
Arena Code	1301	70ᵉ

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
artificialanalysis	0,1 $	0,3 $	0,01 $

Prix en dollars US par million de tokens.

Sa tarification se situe 95 % en dessous de la moyenne des LLM similaires, et 48,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. MiMo-V2-Flash présente un profil intéressant pour un modèle open-weights de très grande taille, avec une fenêtre de contexte suffisamment large pour traiter de longs corpus en une seule requête. À sa sortie, il se situait dans le top 11% de sa génération sur GPQA, ce qui le plaçait dans le haut du panier des LLM sortis sur une période comparable. Son classement en Arena Code est nettement plus favorable que ses résultats en Arena text, ce qui suggère un positionnement relativement plus solide sur les évaluations liées au code que sur les préférences générales en texte. Son principal avantage opérationnel reste le coût, très inférieur à celui des modèles comparables et des modèles haut de gamme.

Limites et points d'attention. Malgré son format massif, MiMo-V2-Flash n’apparaît pas comme un modèle de tête dans les classements globaux : son Intelligence Index le place plutôt en milieu supérieur, tandis que ses résultats en Arena text sont faibles dans le classement disponible. La taille de 309 milliards de paramètres peut aussi peser sur les contraintes d’hébergement et d’inférence, même si la licence MIT facilite l’exploitation commerciale. Le modèle convient surtout aux usages recherchant un grand contexte, des coûts bas et des poids ouverts, plutôt qu’un niveau de performance maximal en conversation générale.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Arena.ai (arena.ai).

MiMo-V2-Flash

Caractéristiques

Indices de synthèse

Performances (benchmarks)

Comment se situe-t-il ?

Classements Arena (Elo)

Tarifs

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast