DeepSeek R1 Distill Llama 8B
DeepSeek R1 Distill Llama 8B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Son format de 8 milliards de paramètres le place dans la famille des modèles compacts de sa génération.
DeepSeek R1 Distill Llama 8B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Son format de 8 milliards de paramètres le place dans la famille des modèles compacts de sa génération.
À l’échelle de l’IA, son ancienneté d’environ un an est déjà importante. Le modèle doit donc être lu comme un jalon de début 2025, avec des connaissances arrêtées au 31 juillet 2024 et une position à sa sortie dans la moitié supérieure des LLM comparables sur GPQA.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | DeepSeek |
| Licence | MIT (open-weights, usage commercial autorisé) |
| Date de sortie | 20 janvier 2025 |
| Connaissances jusqu'à | 2024-07-31 |
| Multimodal | non |
| Paramètres | 8 milliards |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MATH-500 | 89,1 % | 28ᵉ / 31 | llm-stats | Auto-déclaré |
| AIME 2024 | 80,0 % | 27ᵉ / 52 | llm-stats | Auto-déclaré |
| GPQA | 49,0 % | 160ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench | 39,6 % | 49ᵉ / 72 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. DeepSeek R1 Distill Llama 8B se distingue d’abord par son statut open-weights sous licence MIT, qui autorise les usages commerciaux et l’intégration dans des produits sans contrainte propriétaire majeure. À sa sortie, il se situait dans le top 51% sur GPQA parmi les LLM de sa période, ce qui le place dans la moitié supérieure de sa génération sur ce benchmark. Sa taille de 8 milliards de paramètres en fait aussi un modèle plus resserré que les grands modèles généralistes, avec un positionnement cohérent pour des usages où l’ouverture des poids compte autant que le niveau brut de performance.
Limites et points d'attention. Son âge est le principal point faible : environ un an représente un cycle long dans l’IA générative, et ses performances sont aujourd’hui probablement largement dépassées par les modèles plus récents. Le classement GPQA indique un modèle correct pour son époque, mais pas un modèle de tête. Les connaissances s’arrêtent au 31 juillet 2024, ce qui exclut les événements et évolutions postérieurs. Les faits vérifiés disponibles ne fournissent pas de coût d’entraînement ni d’équivalent GPU H100, donc l’effort d’entraînement ne peut pas être quantifié ici. Comme beaucoup de modèles anciens de cette période, il peut aussi ne plus être proposé dans les catalogues actuels de l’éditeur.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).