DeepSeek

DeepSeek R1 Distill Qwen 32B

DeepSeek R1 Distill Qwen 32B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Avec 33 milliards de paramètres et une fenêtre de contexte de 128 000 tokens, il appartient à la génération des grands modèles ouverts capables de…

Son ancienneté, environ un an, est déjà importante à l’échelle de l’IA. DeepSeek R1 Distill Qwen 32B se lit donc surtout comme un modèle marquant de sa période, plutôt que comme une référence actuelle. Ses connaissances s’arrêtent au 31 juillet 2024.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	DeepSeek
Licence	MIT (open-weights, usage commercial autorisé)
Date de sortie	20 janvier 2025
Connaissances jusqu'à	2024-07-31
Multimodal	non
Paramètres	33 milliards
Fenêtre de contexte	128 000 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MATH-500	94,3 %	20ᵉ / 31	llm-stats	Auto-déclaré
AIME 2024	83,3 %	19ᵉ / 52	llm-stats	Auto-déclaré
GPQA	62,1 %	137ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	57,2 %	34ᵉ / 72	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, DeepSeek R1 Distill Qwen 32B figurait dans le haut du panier de sa génération sur GPQA, avec un classement dans le top 25% parmi 59 LLM comparables publiés dans une fenêtre de plus ou moins neuf mois. Cette position indique un niveau solide sur un benchmark exigeant pour les modèles de sa période. Sa licence MIT constitue aussi un atout concret : les poids sont ouverts et l’usage commercial est autorisé, ce qui le distingue des modèles uniquement accessibles via API fermée. Sa fenêtre de contexte de 128 000 tokens reste un élément notable pour analyser ou produire des contenus longs.

Limites et points d'attention. DeepSeek R1 Distill Qwen 32B est ancien pour le marché de l’IA : environ un an correspond à un cycle long, durant lequel les modèles haut de gamme et de nombreux modèles ouverts ont fortement progressé. Ses performances doivent donc être interprétées à l’échelle de janvier 2025, pas comme un indicateur de compétitivité actuelle. Il est probablement dépassé aujourd’hui et souvent retiré des catalogues d’éditeurs au profit de versions plus récentes. Sa coupure de connaissances au 2024-07-31 limite aussi la fiabilité sur les faits postérieurs à cette date.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

DeepSeek R1 Distill Qwen 32B

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast