DeepSeek R1 Zero

DeepSeek R1 Zero est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. À l’échelle de l’IA, son ancienneté d’environ un an le place déjà dans une génération passée, à comparer surtout aux modèles disponibles autour de sa sortie.

DeepSeek R1 Zero est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. À l’échelle de l’IA, son ancienneté d’environ un an le place déjà dans une génération passée, à comparer surtout aux modèles disponibles autour de sa sortie.

Le modèle se distingue par une taille très élevée, 671 milliards de paramètres, et une fenêtre de contexte de 163 840 tokens. Ses connaissances s’arrêtent au 31 juillet 2024, ce qui limite son intérêt pour les sujets récents mais situe clairement son périmètre documentaire.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurDeepSeek
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie20 janvier 2025
Connaissances jusqu'à2024-07-31
Multimodalnon
Paramètres671 milliards
Fenêtre de contexte163 840 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MATH-50095,9 %16ᵉ / 31llm-statsAuto-déclaré
AIME 202486,7 %13ᵉ / 52llm-statsAuto-déclaré
GPQA73,3 %99ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench50,0 %44ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, DeepSeek R1 Zero figurait dans le haut du panier de sa génération sur GPQA, avec un classement dans le top 15% parmi 59 LLM publiés dans une fenêtre comparable. Cette position indique un niveau solide sur un benchmark exigeant pour son époque, sans le présenter comme un modèle de référence actuel. Sa licence MIT et son statut open-weights en font aussi un modèle notable pour l’étude, l’audit ou la réutilisation commerciale, dans les limites des performances de sa génération. Sa très grande fenêtre de contexte constitue un autre trait distinctif, utile pour traiter de longs documents ou de longues conversations.

Limites et points d'attention. DeepSeek R1 Zero est un modèle ancien au rythme du marché IA, avec des performances probablement largement dépassées par les modèles haut de gamme plus récents. Il doit être lu comme un jalon de janvier 2025 plutôt que comme un choix de pointe en 2026, et il est souvent retiré du catalogue de l’éditeur après ce type de cycle. La coupure des connaissances au 31 juillet 2024 exclut les événements et publications postérieurs. Les informations disponibles reposent sur deux sources de données concordantes, ce qui suffit à établir les caractéristiques listées mais ne documente pas davantage son entraînement.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).