DeepSeek

DeepSeek R1 Zero

DeepSeek R1 Zero est un LLM open-weights publié par DeepSeek le 20 janvier 2025 sous licence MIT, avec usage commercial autorisé. À l’échelle de l’IA, son ancienneté d’environ un an le place déjà dans une génération passée, à comparer surtout aux modèles disponibles autour de sa sortie.

Le modèle se distingue par une taille très élevée, 671 milliards de paramètres, et une fenêtre de contexte de 163 840 tokens. Ses connaissances s’arrêtent au 31 juillet 2024, ce qui limite son intérêt pour les sujets récents mais situe clairement son périmètre documentaire.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	DeepSeek
Licence	MIT (open-weights, usage commercial autorisé)
Date de sortie	20 janvier 2025
Connaissances jusqu'à	2024-07-31
Multimodal	non
Paramètres	671 milliards
Fenêtre de contexte	163 840 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MATH-500	95,9 %	16ᵉ / 31	llm-stats	Auto-déclaré
AIME 2024	86,7 %	13ᵉ / 52	llm-stats	Auto-déclaré
GPQA	73,3 %	99ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	50,0 %	44ᵉ / 72	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, DeepSeek R1 Zero figurait dans le haut du panier de sa génération sur GPQA, avec un classement dans le top 15% parmi 59 LLM publiés dans une fenêtre comparable. Cette position indique un niveau solide sur un benchmark exigeant pour son époque, sans le présenter comme un modèle de référence actuel. Sa licence MIT et son statut open-weights en font aussi un modèle notable pour l’étude, l’audit ou la réutilisation commerciale, dans les limites des performances de sa génération. Sa très grande fenêtre de contexte constitue un autre trait distinctif, utile pour traiter de longs documents ou de longues conversations.

Limites et points d'attention. DeepSeek R1 Zero est un modèle ancien au rythme du marché IA, avec des performances probablement largement dépassées par les modèles haut de gamme plus récents. Il doit être lu comme un jalon de janvier 2025 plutôt que comme un choix de pointe en 2026, et il est souvent retiré du catalogue de l’éditeur après ce type de cycle. La coupure des connaissances au 31 juillet 2024 exclut les événements et publications postérieurs. Les informations disponibles reposent sur deux sources de données concordantes, ce qui suffit à établir les caractéristiques listées mais ne documente pas davantage son entraînement.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

DeepSeek R1 Zero

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast