DeepSeek R1 Distill Llama 8B

DeepSeek R1 Distill Llama 8B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Son format de 8 milliards de paramètres le place dans la famille des modèles compacts de sa génération.

DeepSeek R1 Distill Llama 8B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Son format de 8 milliards de paramètres le place dans la famille des modèles compacts de sa génération.

À l’échelle de l’IA, son ancienneté d’environ un an est déjà importante. Le modèle doit donc être lu comme un jalon de début 2025, avec des connaissances arrêtées au 31 juillet 2024 et une position à sa sortie dans la moitié supérieure des LLM comparables sur GPQA.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurDeepSeek
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie20 janvier 2025
Connaissances jusqu'à2024-07-31
Multimodalnon
Paramètres8 milliards
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MATH-50089,1 %28ᵉ / 31llm-statsAuto-déclaré
AIME 202480,0 %27ᵉ / 52llm-statsAuto-déclaré
GPQA49,0 %160ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench39,6 %49ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. DeepSeek R1 Distill Llama 8B se distingue d’abord par son statut open-weights sous licence MIT, qui autorise les usages commerciaux et l’intégration dans des produits sans contrainte propriétaire majeure. À sa sortie, il se situait dans le top 51% sur GPQA parmi les LLM de sa période, ce qui le place dans la moitié supérieure de sa génération sur ce benchmark. Sa taille de 8 milliards de paramètres en fait aussi un modèle plus resserré que les grands modèles généralistes, avec un positionnement cohérent pour des usages où l’ouverture des poids compte autant que le niveau brut de performance.

Limites et points d'attention. Son âge est le principal point faible : environ un an représente un cycle long dans l’IA générative, et ses performances sont aujourd’hui probablement largement dépassées par les modèles plus récents. Le classement GPQA indique un modèle correct pour son époque, mais pas un modèle de tête. Les connaissances s’arrêtent au 31 juillet 2024, ce qui exclut les événements et évolutions postérieurs. Les faits vérifiés disponibles ne fournissent pas de coût d’entraînement ni d’équivalent GPU H100, donc l’effort d’entraînement ne peut pas être quantifié ici. Comme beaucoup de modèles anciens de cette période, il peut aussi ne plus être proposé dans les catalogues actuels de l’éditeur.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).