DeepSeek R1 Zero
DeepSeek R1 Zero est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. À l’échelle de l’IA, son ancienneté d’environ un an le place déjà dans une génération passée, à comparer surtout aux modèles disponibles autour de sa sortie.
DeepSeek R1 Zero est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. À l’échelle de l’IA, son ancienneté d’environ un an le place déjà dans une génération passée, à comparer surtout aux modèles disponibles autour de sa sortie.
Le modèle se distingue par une taille très élevée, 671 milliards de paramètres, et une fenêtre de contexte de 163 840 tokens. Ses connaissances s’arrêtent au 31 juillet 2024, ce qui limite son intérêt pour les sujets récents mais situe clairement son périmètre documentaire.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | DeepSeek |
| Licence | MIT (open-weights, usage commercial autorisé) |
| Date de sortie | 20 janvier 2025 |
| Connaissances jusqu'à | 2024-07-31 |
| Multimodal | non |
| Paramètres | 671 milliards |
| Fenêtre de contexte | 163 840 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MATH-500 | 95,9 % | 16ᵉ / 31 | llm-stats | Auto-déclaré |
| AIME 2024 | 86,7 % | 13ᵉ / 52 | llm-stats | Auto-déclaré |
| GPQA | 73,3 % | 99ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench | 50,0 % | 44ᵉ / 72 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. À sa sortie, DeepSeek R1 Zero figurait dans le haut du panier de sa génération sur GPQA, avec un classement dans le top 15% parmi 59 LLM publiés dans une fenêtre comparable. Cette position indique un niveau solide sur un benchmark exigeant pour son époque, sans le présenter comme un modèle de référence actuel. Sa licence MIT et son statut open-weights en font aussi un modèle notable pour l’étude, l’audit ou la réutilisation commerciale, dans les limites des performances de sa génération. Sa très grande fenêtre de contexte constitue un autre trait distinctif, utile pour traiter de longs documents ou de longues conversations.
Limites et points d'attention. DeepSeek R1 Zero est un modèle ancien au rythme du marché IA, avec des performances probablement largement dépassées par les modèles haut de gamme plus récents. Il doit être lu comme un jalon de janvier 2025 plutôt que comme un choix de pointe en 2026, et il est souvent retiré du catalogue de l’éditeur après ce type de cycle. La coupure des connaissances au 31 juillet 2024 exclut les événements et publications postérieurs. Les informations disponibles reposent sur deux sources de données concordantes, ce qui suffit à établir les caractéristiques listées mais ne documente pas davantage son entraînement.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).