DeepSeek R1 Distill Qwen 32B

DeepSeek R1 Distill Qwen 32B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Avec 33 milliards de paramètres et une fenêtre de contexte de 128 000 tokens, il appartient à la génération des grands modèles ouverts capables de…

DeepSeek R1 Distill Qwen 32B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Avec 33 milliards de paramètres et une fenêtre de contexte de 128 000 tokens, il appartient à la génération des grands modèles ouverts capables de traiter de longs volumes de texte.

Son ancienneté, environ un an, est déjà importante à l’échelle de l’IA. DeepSeek R1 Distill Qwen 32B se lit donc surtout comme un modèle marquant de sa période, plutôt que comme une référence actuelle. Ses connaissances s’arrêtent au 31 juillet 2024.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurDeepSeek
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie20 janvier 2025
Connaissances jusqu'à2024-07-31
Multimodalnon
Paramètres33 milliards
Fenêtre de contexte128 000 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MATH-50094,3 %20ᵉ / 31llm-statsAuto-déclaré
AIME 202483,3 %19ᵉ / 52llm-statsAuto-déclaré
GPQA62,1 %137ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench57,2 %34ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, DeepSeek R1 Distill Qwen 32B figurait dans le haut du panier de sa génération sur GPQA, avec un classement dans le top 25% parmi 59 LLM comparables publiés dans une fenêtre de plus ou moins neuf mois. Cette position indique un niveau solide sur un benchmark exigeant pour les modèles de sa période. Sa licence MIT constitue aussi un atout concret : les poids sont ouverts et l’usage commercial est autorisé, ce qui le distingue des modèles uniquement accessibles via API fermée. Sa fenêtre de contexte de 128 000 tokens reste un élément notable pour analyser ou produire des contenus longs.

Limites et points d'attention. DeepSeek R1 Distill Qwen 32B est ancien pour le marché de l’IA : environ un an correspond à un cycle long, durant lequel les modèles haut de gamme et de nombreux modèles ouverts ont fortement progressé. Ses performances doivent donc être interprétées à l’échelle de janvier 2025, pas comme un indicateur de compétitivité actuelle. Il est probablement dépassé aujourd’hui et souvent retiré des catalogues d’éditeurs au profit de versions plus récentes. Sa coupure de connaissances au 2024-07-31 limite aussi la fiabilité sur les faits postérieurs à cette date.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).