DeepSeek R1 Distill Qwen 14B
DeepSeek R1 Distill Qwen 14B est un LLM open-weights publié par DeepSeek le 20 janvier 2025, sous licence MIT avec usage commercial autorisé. Âgé d’environ un an, il appartient déjà à une génération ancienne à l’échelle de l’IA, à comparer surtout aux modèles de sa période plutôt qu’aux…
DeepSeek R1 Distill Qwen 14B est un LLM open-weights publié par DeepSeek le 20 janvier 2025, sous licence MIT avec usage commercial autorisé. Âgé d’environ un an, il appartient déjà à une génération ancienne à l’échelle de l’IA, à comparer surtout aux modèles de sa période plutôt qu’aux modèles haut de gamme actuels.
Le modèle se distingue par un format relativement compact de 15 milliards de paramètres et une large fenêtre de contexte de 131 072 tokens. Ses connaissances s’arrêtent au 31 juillet 2024, ce qui limite son intérêt pour les sujets récents mais situe clairement son périmètre documentaire.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | DeepSeek |
| Licence | MIT (open-weights, usage commercial autorisé) |
| Date de sortie | 20 janvier 2025 |
| Connaissances jusqu'à | 2024-07-31 |
| Multimodal | non |
| Paramètres | 15 milliards |
| Fenêtre de contexte | 131 072 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: MATH level 5 | 87,1 % | 19ᵉ / 84 | epoch | ✅ Mesuré |
| Epoch: GPQA diamond | 44,7 % | 94ᵉ / 132 | epoch | ✅ Mesuré |
| MATH-500 | 93,9 % | 22ᵉ / 31 | llm-stats | Auto-déclaré |
| AIME 2024 | 80,0 % | 27ᵉ / 52 | llm-stats | Auto-déclaré |
| GPQA | 59,1 % | 141ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench | 53,1 % | 40ᵉ / 72 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Epoch: MATH level 5
Epoch: GPQA diamond
Notre analyse
Forces. DeepSeek R1 Distill Qwen 14B montre son meilleur profil sur MATH level 5, où il se place dans le haut du tableau des modèles évalués. Ce résultat indique une solidité notable sur les tâches mathématiques exigeantes pour un modèle de 15 milliards de paramètres. À sa sortie, son classement sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat, le plaçait dans le top 44% des LLM de sa génération, soit une position correcte sans relever du tout premier plan. Sa licence MIT et ses poids ouverts renforcent son intérêt pratique pour l’expérimentation, la réutilisation et les déploiements commerciaux indépendants.
Limites et points d'attention. Son ancienneté pèse fortement : environ un an représente un écart important dans l’IA générative, et ses performances sont aujourd’hui largement dépassées par les modèles plus récents. Il est aussi souvent retiré des catalogues actifs des éditeurs à ce stade de cycle. Son score sur GPQA diamond reste modeste dans le classement global, ce qui limite sa crédibilité sur les raisonnements scientifiques complexes. La coupure des connaissances au 31 juillet 2024 impose enfin une prudence nette sur l’actualité, les technologies récentes et les références postérieures.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.