Kimi K2-Instruct-0905
Kimi K2-Instruct-0905 est un LLM de Moonshot AI publié le 5 septembre 2025. Il se distingue par son format open-weights sous licence MIT, qui autorise l’usage commercial et le place dans la catégorie des grands modèles réutilisables hors d’une offre fermée.
Kimi K2-Instruct-0905 est un LLM de Moonshot AI publié le 5 septembre 2025. Il se distingue par son format open-weights sous licence MIT, qui autorise l’usage commercial et le place dans la catégorie des grands modèles réutilisables hors d’une offre fermée.
Son autre marqueur est l’échelle, avec 1000 milliards de paramètres. À sa sortie, son résultat sur GPQA le situait dans le top 25% des 130 LLM de sa génération, soit les modèles sortis dans les 18 mois environ précédant sa publication.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Moonshot AI |
| Licence | MIT (open-weights, usage commercial autorisé) |
| Date de sortie | 5 septembre 2025 |
| Multimodal | non |
| Paramètres | 1000 milliards |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MATH-500 | 97,4 % | 6ᵉ / 31 | llm-stats | Auto-déclaré |
| MMLU-Redux | 92,7 % | 16ᵉ / 48 | llm-stats | Auto-déclaré |
| IFEval | 89,8 % | 16ᵉ / 65 | llm-stats | Auto-déclaré |
| MMLU | 89,5 % | 12ᵉ / 98 | llm-stats | Auto-déclaré |
| ZebraLogic | 89,0 % | 5ᵉ / 7 | llm-stats | Auto-déclaré |
| MultiPL-E | 85,7 % | 4ᵉ / 13 | llm-stats | Auto-déclaré |
| MMLU-Pro | 81,1 % | 44ᵉ / 125 | llm-stats | Auto-déclaré |
| LiveBench | 76,4 % | 9ᵉ / 38 | llm-stats | Auto-déclaré |
| GPQA | 75,1 % | 91ᵉ / 213 | llm-stats | Auto-déclaré |
| CNMO 2024 | 74,3 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| Tau2 Retail | 70,6 % | 19ᵉ / 25 | llm-stats | Auto-déclaré |
| AIME 2024 | 69,6 % | 40ᵉ / 52 | llm-stats | Auto-déclaré |
| SWE-Bench Verified | 65,8 % | 69ᵉ / 100 | llm-stats | Auto-déclaré |
| Tau2 Telecom | 65,8 % | 26ᵉ / 34 | llm-stats | Auto-déclaré |
| Aider-Polyglot | 60,0 % | 12ᵉ / 22 | llm-stats | Auto-déclaré |
| SuperGPQA | 57,2 % | 21ᵉ / 34 | llm-stats | Auto-déclaré |
| Tau2 Airline | 56,5 % | 15ᵉ / 22 | llm-stats | Auto-déclaré |
| Multi-Challenge | 54,1 % | 14ᵉ / 28 | llm-stats | Auto-déclaré |
| LiveCodeBench | 53,7 % | 39ᵉ / 72 | llm-stats | Auto-déclaré |
| AIME 2025 | 49,5 % | 96ᵉ / 108 | llm-stats | Auto-déclaré |
| SWE-bench Multilingual | 47,3 % | 28ᵉ / 32 | llm-stats | Auto-déclaré |
| HMMT 2025 | 38,8 % | 29ᵉ / 33 | llm-stats | Auto-déclaré |
| SimpleQA | 31,0 % | 24ᵉ / 45 | llm-stats | Auto-déclaré |
| OJBench | 27,1 % | 8ᵉ / 9 | llm-stats | Auto-déclaré |
| Terminal-Bench | 25,0 % | 23ᵉ / 25 | llm-stats | Auto-déclaré |
| Humanity's Last Exam | 4,7 % | 84ᵉ / 86 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Kimi K2-Instruct-0905 combine une très grande taille, une licence permissive et un positionnement compétitif à sa sortie. Le classement GPQA indique qu’il appartenait alors au haut du panier de sa génération, sans être limité à une simple présence en milieu de tableau. La licence MIT constitue aussi un point fort concret, car elle permet l’usage commercial des poids ouverts, un choix important pour l’intégration, l’hébergement indépendant et l’adaptation dans des environnements contrôlés.
Limites et points d’attention. La fiche repose sur une seule source de données concordante, ce qui limite la validation croisée des informations disponibles. Les seuls éléments chiffrés fournis concernent la taille du modèle et sa position relative sur GPQA, sans détail sur d’autres benchmarks, les coûts d’inférence, le contexte maximal, les langues prises en charge ou les conditions d’entraînement. Kimi K2-Instruct-0905 reste donc surtout notable pour son échelle, son ouverture sous licence MIT et son bon positionnement initial sur GPQA, plutôt que pour un profil de performances documenté de façon large.
Sources des données : LLM-Stats (llm-stats.com).