Kimi K2-Instruct-0905

Kimi K2-Instruct-0905 est un LLM de Moonshot AI publié le 5 septembre 2025. Il se distingue par son format open-weights sous licence MIT, qui autorise l’usage commercial et le place dans la catégorie des grands modèles réutilisables hors d’une offre fermée.

Kimi K2-Instruct-0905 est un LLM de Moonshot AI publié le 5 septembre 2025. Il se distingue par son format open-weights sous licence MIT, qui autorise l’usage commercial et le place dans la catégorie des grands modèles réutilisables hors d’une offre fermée.

Son autre marqueur est l’échelle, avec 1000 milliards de paramètres. À sa sortie, son résultat sur GPQA le situait dans le top 25% des 130 LLM de sa génération, soit les modèles sortis dans les 18 mois environ précédant sa publication.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMoonshot AI
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie5 septembre 2025
Multimodalnon
Paramètres1000 milliards

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MATH-50097,4 %6ᵉ / 31llm-statsAuto-déclaré
MMLU-Redux92,7 %16ᵉ / 48llm-statsAuto-déclaré
IFEval89,8 %16ᵉ / 65llm-statsAuto-déclaré
MMLU89,5 %12ᵉ / 98llm-statsAuto-déclaré
ZebraLogic89,0 %5ᵉ / 7llm-statsAuto-déclaré
MultiPL-E85,7 %4ᵉ / 13llm-statsAuto-déclaré
MMLU-Pro81,1 %44ᵉ / 125llm-statsAuto-déclaré
LiveBench76,4 %9ᵉ / 38llm-statsAuto-déclaré
GPQA75,1 %91ᵉ / 213llm-statsAuto-déclaré
CNMO 202474,3 %1ᵉ / 3llm-statsAuto-déclaré
Tau2 Retail70,6 %19ᵉ / 25llm-statsAuto-déclaré
AIME 202469,6 %40ᵉ / 52llm-statsAuto-déclaré
SWE-Bench Verified65,8 %69ᵉ / 100llm-statsAuto-déclaré
Tau2 Telecom65,8 %26ᵉ / 34llm-statsAuto-déclaré
Aider-Polyglot60,0 %12ᵉ / 22llm-statsAuto-déclaré
SuperGPQA57,2 %21ᵉ / 34llm-statsAuto-déclaré
Tau2 Airline56,5 %15ᵉ / 22llm-statsAuto-déclaré
Multi-Challenge54,1 %14ᵉ / 28llm-statsAuto-déclaré
LiveCodeBench53,7 %39ᵉ / 72llm-statsAuto-déclaré
AIME 202549,5 %96ᵉ / 108llm-statsAuto-déclaré
SWE-bench Multilingual47,3 %28ᵉ / 32llm-statsAuto-déclaré
HMMT 202538,8 %29ᵉ / 33llm-statsAuto-déclaré
SimpleQA31,0 %24ᵉ / 45llm-statsAuto-déclaré
OJBench27,1 %8ᵉ / 9llm-statsAuto-déclaré
Terminal-Bench25,0 %23ᵉ / 25llm-statsAuto-déclaré
Humanity's Last Exam4,7 %84ᵉ / 86llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Kimi K2-Instruct-0905 combine une très grande taille, une licence permissive et un positionnement compétitif à sa sortie. Le classement GPQA indique qu’il appartenait alors au haut du panier de sa génération, sans être limité à une simple présence en milieu de tableau. La licence MIT constitue aussi un point fort concret, car elle permet l’usage commercial des poids ouverts, un choix important pour l’intégration, l’hébergement indépendant et l’adaptation dans des environnements contrôlés.

Limites et points d’attention. La fiche repose sur une seule source de données concordante, ce qui limite la validation croisée des informations disponibles. Les seuls éléments chiffrés fournis concernent la taille du modèle et sa position relative sur GPQA, sans détail sur d’autres benchmarks, les coûts d’inférence, le contexte maximal, les langues prises en charge ou les conditions d’entraînement. Kimi K2-Instruct-0905 reste donc surtout notable pour son échelle, son ouverture sous licence MIT et son bon positionnement initial sur GPQA, plutôt que pour un profil de performances documenté de façon large.


Sources des données : LLM-Stats (llm-stats.com).