DeepSeek R1 Distill Qwen 1.5B
DeepSeek R1 Distill Qwen 1.5B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Avec environ un an d’ancienneté, il appartient déjà à une génération très datée à l’échelle de l’IA, à comparer surtout aux modèles disponibles…
DeepSeek R1 Distill Qwen 1.5B est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. Avec environ un an d’ancienneté, il appartient déjà à une génération très datée à l’échelle de l’IA, à comparer surtout aux modèles disponibles autour de sa sortie.
Le modèle se distingue par un format compact de 2 milliards de paramètres et une fenêtre de contexte de 131 072 tokens. Ses connaissances s’arrêtent au 31 juillet 2024, ce qui limite mécaniquement sa couverture des événements, outils et pratiques apparus ensuite.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | DeepSeek |
| Licence | MIT (open-weights, usage commercial autorisé) |
| Date de sortie | 20 janvier 2025 |
| Connaissances jusqu'à | 2024-07-31 |
| Multimodal | non |
| Paramètres | 2 milliards |
| Fenêtre de contexte | 131 072 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MATH-500 | 83,9 % | 29ᵉ / 31 | llm-stats | Auto-déclaré |
| AIME 2024 | 52,7 % | 44ᵉ / 52 | llm-stats | Auto-déclaré |
| GPQA | 33,8 % | 195ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench | 16,9 % | 66ᵉ / 72 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. DeepSeek R1 Distill Qwen 1.5B combine trois caractéristiques concrètes : des poids ouverts, une licence MIT compatible avec un usage commercial, et une taille réduite par rapport aux grands LLM. Sa fenêtre de contexte de 131 072 tokens constitue aussi un point notable pour un modèle de ce gabarit. À sa sortie, son résultat GPQA, benchmark orienté questions scientifiques difficiles, le situait dans le top 86% des LLM de sa génération comparés sur la même période, ce qui donne un repère historique plutôt qu’un signal de domination.
Limites et points d’attention. Son ancienneté pèse fortement : un modèle publié début 2025 avec des connaissances arrêtées à juillet 2024 est aujourd’hui largement dépassé par les modèles haut de gamme plus récents. Il est aussi probablement retiré ou moins mis en avant dans les catalogues actuels de l’éditeur, comme beaucoup de modèles de cette période. La couverture repose sur 2 sources concordantes, ce qui donne une base vérifiée, mais ne permet pas d’étendre l’analyse à des capacités non documentées ici.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).