DeepSeek

DeepSeek R1 Distill Qwen 14B

DeepSeek R1 Distill Qwen 14B est un LLM open-weights publié par DeepSeek le 20 janvier 2025, sous licence MIT avec usage commercial autorisé. Âgé d’environ un an, il appartient déjà à une génération ancienne à l’échelle de l’IA, à comparer surtout aux modèles de sa période plutôt qu’aux…

Le modèle se distingue par un format relativement compact de 15 milliards de paramètres et une large fenêtre de contexte de 131 072 tokens. Ses connaissances s’arrêtent au 31 juillet 2024, ce qui limite son intérêt pour les sujets récents mais situe clairement son périmètre documentaire.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	DeepSeek
Licence	MIT (open-weights, usage commercial autorisé)
Date de sortie	20 janvier 2025
Connaissances jusqu'à	2024-07-31
Multimodal	non
Paramètres	15 milliards
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Epoch: MATH level 5	87,1 %	19ᵉ / 84	epoch	✅ Mesuré
Epoch: GPQA diamond	44,7 %	94ᵉ / 132	epoch	✅ Mesuré
MATH-500	93,9 %	22ᵉ / 31	llm-stats	Auto-déclaré
AIME 2024	80,0 %	27ᵉ / 52	llm-stats	Auto-déclaré
GPQA	59,1 %	141ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	53,1 %	40ᵉ / 72	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: MATH level 5

GPT-598 %

Claude Sonnet 4.598 %

Qwen3-Max-Instruct97 %

Grok-3 Mini91 %

▶ DeepSeek R1 Distill Qwe…87 %

Gemini 2.0 Flash82 %

Epoch: GPQA diamond

GPT-5.4 Pro95 %

Gemini 3.1 Pro Preview94 %

Qwen3.7 Max92 %

Phi 456 %

▶ DeepSeek R1 Distill Qwe…45 %

Notre analyse

Forces. DeepSeek R1 Distill Qwen 14B montre son meilleur profil sur MATH level 5, où il se place dans le haut du tableau des modèles évalués. Ce résultat indique une solidité notable sur les tâches mathématiques exigeantes pour un modèle de 15 milliards de paramètres. À sa sortie, son classement sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat, le plaçait dans le top 44% des LLM de sa génération, soit une position correcte sans relever du tout premier plan. Sa licence MIT et ses poids ouverts renforcent son intérêt pratique pour l’expérimentation, la réutilisation et les déploiements commerciaux indépendants.

Limites et points d'attention. Son ancienneté pèse fortement : environ un an représente un écart important dans l’IA générative, et ses performances sont aujourd’hui largement dépassées par les modèles plus récents. Il est aussi souvent retiré des catalogues actifs des éditeurs à ce stade de cycle. Son score sur GPQA diamond reste modeste dans le classement global, ce qui limite sa crédibilité sur les raisonnements scientifiques complexes. La coupure des connaissances au 31 juillet 2024 impose enfin une prudence nette sur l’actualité, les technologies récentes et les références postérieures.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.

DeepSeek R1 Distill Qwen 14B

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast