Moonshot AI

Kimi K2-Instruct-0905

Kimi K2-Instruct-0905 est un LLM de Moonshot AI publié le 5 septembre 2025. Il se distingue par son format open-weights sous licence MIT, qui autorise l’usage commercial et le place dans la catégorie des grands modèles réutilisables hors d’une offre fermée.

Son autre marqueur est l’échelle, avec 1000 milliards de paramètres. À sa sortie, son résultat sur GPQA le situait dans le top 25% des 130 LLM de sa génération, soit les modèles sortis dans les 18 mois environ précédant sa publication.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Moonshot AI
Licence	MIT (open-weights, usage commercial autorisé)
Date de sortie	5 septembre 2025
Multimodal	non
Paramètres	1000 milliards

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MATH-500	97,4 %	6ᵉ / 31	llm-stats	Auto-déclaré
MMLU-Redux	92,7 %	16ᵉ / 48	llm-stats	Auto-déclaré
IFEval	89,8 %	16ᵉ / 65	llm-stats	Auto-déclaré
MMLU	89,5 %	12ᵉ / 98	llm-stats	Auto-déclaré
ZebraLogic	89,0 %	5ᵉ / 7	llm-stats	Auto-déclaré
MultiPL-E	85,7 %	4ᵉ / 13	llm-stats	Auto-déclaré
MMLU-Pro	81,1 %	44ᵉ / 125	llm-stats	Auto-déclaré
LiveBench	76,4 %	9ᵉ / 38	llm-stats	Auto-déclaré
GPQA	75,1 %	91ᵉ / 213	llm-stats	Auto-déclaré
CNMO 2024	74,3 %	1ᵉ / 3	llm-stats	Auto-déclaré
Tau2 Retail	70,6 %	19ᵉ / 25	llm-stats	Auto-déclaré
AIME 2024	69,6 %	40ᵉ / 52	llm-stats	Auto-déclaré
SWE-Bench Verified	65,8 %	69ᵉ / 100	llm-stats	Auto-déclaré
Tau2 Telecom	65,8 %	26ᵉ / 34	llm-stats	Auto-déclaré
Aider-Polyglot	60,0 %	12ᵉ / 22	llm-stats	Auto-déclaré
SuperGPQA	57,2 %	21ᵉ / 34	llm-stats	Auto-déclaré
Tau2 Airline	56,5 %	15ᵉ / 22	llm-stats	Auto-déclaré
Multi-Challenge	54,1 %	14ᵉ / 28	llm-stats	Auto-déclaré
LiveCodeBench	53,7 %	39ᵉ / 72	llm-stats	Auto-déclaré
AIME 2025	49,5 %	96ᵉ / 108	llm-stats	Auto-déclaré
SWE-bench Multilingual	47,3 %	28ᵉ / 32	llm-stats	Auto-déclaré
HMMT 2025	38,8 %	29ᵉ / 33	llm-stats	Auto-déclaré
SimpleQA	31,0 %	24ᵉ / 45	llm-stats	Auto-déclaré
OJBench	27,1 %	8ᵉ / 9	llm-stats	Auto-déclaré
Terminal-Bench	25,0 %	23ᵉ / 25	llm-stats	Auto-déclaré
Humanity's Last Exam	4,7 %	84ᵉ / 86	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Kimi K2-Instruct-0905 combine une très grande taille, une licence permissive et un positionnement compétitif à sa sortie. Le classement GPQA indique qu’il appartenait alors au haut du panier de sa génération, sans être limité à une simple présence en milieu de tableau. La licence MIT constitue aussi un point fort concret, car elle permet l’usage commercial des poids ouverts, un choix important pour l’intégration, l’hébergement indépendant et l’adaptation dans des environnements contrôlés.

Limites et points d’attention. La fiche repose sur une seule source de données concordante, ce qui limite la validation croisée des informations disponibles. Les seuls éléments chiffrés fournis concernent la taille du modèle et sa position relative sur GPQA, sans détail sur d’autres benchmarks, les coûts d’inférence, le contexte maximal, les langues prises en charge ou les conditions d’entraînement. Kimi K2-Instruct-0905 reste donc surtout notable pour son échelle, son ouverture sous licence MIT et son bon positionnement initial sur GPQA, plutôt que pour un profil de performances documenté de façon large.

Sources des données : LLM-Stats (llm-stats.com).

Kimi K2-Instruct-0905

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast