DeepSeek R1 Distill Qwen 14B

DeepSeek R1 Distill Qwen 14B est un LLM open-weights publié par DeepSeek le 20 janvier 2025, sous licence MIT avec usage commercial autorisé. Âgé d’environ un an, il appartient déjà à une génération ancienne à l’échelle de l’IA, à comparer surtout aux modèles de sa période plutôt qu’aux…

DeepSeek R1 Distill Qwen 14B est un LLM open-weights publié par DeepSeek le 20 janvier 2025, sous licence MIT avec usage commercial autorisé. Âgé d’environ un an, il appartient déjà à une génération ancienne à l’échelle de l’IA, à comparer surtout aux modèles de sa période plutôt qu’aux modèles haut de gamme actuels.

Le modèle se distingue par un format relativement compact de 15 milliards de paramètres et une large fenêtre de contexte de 131 072 tokens. Ses connaissances s’arrêtent au 31 juillet 2024, ce qui limite son intérêt pour les sujets récents mais situe clairement son périmètre documentaire.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurDeepSeek
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie20 janvier 2025
Connaissances jusqu'à2024-07-31
Multimodalnon
Paramètres15 milliards
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: MATH level 587,1 %19ᵉ / 84epoch✅ Mesuré
Epoch: GPQA diamond44,7 %94ᵉ / 132epoch✅ Mesuré
MATH-50093,9 %22ᵉ / 31llm-statsAuto-déclaré
AIME 202480,0 %27ᵉ / 52llm-statsAuto-déclaré
GPQA59,1 %141ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench53,1 %40ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: MATH level 5

GPT-598 %
Qwen3-Max-Instruct97 %
Grok-3 Mini91 %
▶ DeepSeek R1 Distill Qwe…87 %
Gemini 2.0 Flash82 %

Epoch: GPQA diamond

GPT-5.4 Pro95 %
Gemini 3.1 Pro Preview94 %
Qwen3.7 Max92 %
Phi 456 %
▶ DeepSeek R1 Distill Qwe…45 %

Notre analyse

Forces. DeepSeek R1 Distill Qwen 14B montre son meilleur profil sur MATH level 5, où il se place dans le haut du tableau des modèles évalués. Ce résultat indique une solidité notable sur les tâches mathématiques exigeantes pour un modèle de 15 milliards de paramètres. À sa sortie, son classement sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat, le plaçait dans le top 44% des LLM de sa génération, soit une position correcte sans relever du tout premier plan. Sa licence MIT et ses poids ouverts renforcent son intérêt pratique pour l’expérimentation, la réutilisation et les déploiements commerciaux indépendants.

Limites et points d'attention. Son ancienneté pèse fortement : environ un an représente un écart important dans l’IA générative, et ses performances sont aujourd’hui largement dépassées par les modèles plus récents. Il est aussi souvent retiré des catalogues actifs des éditeurs à ce stade de cycle. Son score sur GPQA diamond reste modeste dans le classement global, ce qui limite sa crédibilité sur les raisonnements scientifiques complexes. La coupure des connaissances au 31 juillet 2024 impose enfin une prudence nette sur l’actualité, les technologies récentes et les références postérieures.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.