DeepSeek

DeepSeek R1 Distill Qwen 1.5B

DeepSeek R1 Distill Qwen 1.5B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Avec environ un an d’ancienneté, il appartient déjà à une génération très datée à l’échelle de l’IA, à comparer surtout aux modèles disponibles…

Le modèle se distingue par un format compact de 2 milliards de paramètres et une fenêtre de contexte de 131 072 tokens. Ses connaissances s’arrêtent au 31 juillet 2024, ce qui limite mécaniquement sa couverture des événements, outils et pratiques apparus ensuite.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	DeepSeek
Licence	MIT (open-weights, usage commercial autorisé)
Date de sortie	20 janvier 2025
Connaissances jusqu'à	2024-07-31
Multimodal	non
Paramètres	2 milliards
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MATH-500	83,9 %	29ᵉ / 31	llm-stats	Auto-déclaré
AIME 2024	52,7 %	44ᵉ / 52	llm-stats	Auto-déclaré
GPQA	33,8 %	195ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	16,9 %	66ᵉ / 72	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. DeepSeek R1 Distill Qwen 1.5B combine trois caractéristiques concrètes : des poids ouverts, une licence MIT compatible avec un usage commercial, et une taille réduite par rapport aux grands LLM. Sa fenêtre de contexte de 131 072 tokens constitue aussi un point notable pour un modèle de ce gabarit. À sa sortie, son résultat GPQA, benchmark orienté questions scientifiques difficiles, le situait dans le top 86% des LLM de sa génération comparés sur la même période, ce qui donne un repère historique plutôt qu’un signal de domination.

Limites et points d’attention. Son ancienneté pèse fortement : un modèle publié début 2025 avec des connaissances arrêtées à juillet 2024 est aujourd’hui largement dépassé par les modèles haut de gamme plus récents. Il est aussi probablement retiré ou moins mis en avant dans les catalogues actuels de l’éditeur, comme beaucoup de modèles de cette période. La couverture repose sur 2 sources concordantes, ce qui donne une base vérifiée, mais ne permet pas d’étendre l’analyse à des capacités non documentées ici.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

DeepSeek R1 Distill Qwen 1.5B

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast