DeepSeek

DeepSeek R1 Distill Llama 8B

DeepSeek R1 Distill Llama 8B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Son format de 8 milliards de paramètres le place dans la famille des modèles compacts de sa génération.

À l’échelle de l’IA, son ancienneté d’environ un an est déjà importante. Le modèle doit donc être lu comme un jalon de début 2025, avec des connaissances arrêtées au 31 juillet 2024 et une position à sa sortie dans la moitié supérieure des LLM comparables sur GPQA.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	DeepSeek
Licence	MIT (open-weights, usage commercial autorisé)
Date de sortie	20 janvier 2025
Connaissances jusqu'à	2024-07-31
Multimodal	non
Paramètres	8 milliards
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MATH-500	89,1 %	28ᵉ / 31	llm-stats	Auto-déclaré
AIME 2024	80,0 %	27ᵉ / 52	llm-stats	Auto-déclaré
GPQA	49,0 %	160ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	39,6 %	49ᵉ / 72	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. DeepSeek R1 Distill Llama 8B se distingue d’abord par son statut open-weights sous licence MIT, qui autorise les usages commerciaux et l’intégration dans des produits sans contrainte propriétaire majeure. À sa sortie, il se situait dans le top 51% sur GPQA parmi les LLM de sa période, ce qui le place dans la moitié supérieure de sa génération sur ce benchmark. Sa taille de 8 milliards de paramètres en fait aussi un modèle plus resserré que les grands modèles généralistes, avec un positionnement cohérent pour des usages où l’ouverture des poids compte autant que le niveau brut de performance.

Limites et points d'attention. Son âge est le principal point faible : environ un an représente un cycle long dans l’IA générative, et ses performances sont aujourd’hui probablement largement dépassées par les modèles plus récents. Le classement GPQA indique un modèle correct pour son époque, mais pas un modèle de tête. Les connaissances s’arrêtent au 31 juillet 2024, ce qui exclut les événements et évolutions postérieurs. Les faits vérifiés disponibles ne fournissent pas de coût d’entraînement ni d’équivalent GPU H100, donc l’effort d’entraînement ne peut pas être quantifié ici. Comme beaucoup de modèles anciens de cette période, il peut aussi ne plus être proposé dans les catalogues actuels de l’éditeur.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

DeepSeek R1 Distill Llama 8B

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast