DeepSeek-V3.2-Speciale

DeepSeek-V3.2-Speciale est un LLM de DeepSeek publié le 1 décembre 2025, sous licence MIT avec poids ouverts et usage commercial autorisé. Son positionnement combine une très grande taille de modèle et une fenêtre de contexte longue, ce qui le place dans la catégorie des modèles…

DeepSeek-V3.2-Speciale est un LLM de DeepSeek publié le 1 décembre 2025, sous licence MIT avec poids ouverts et usage commercial autorisé. Son positionnement combine une très grande taille de modèle et une fenêtre de contexte longue, ce qui le place dans la catégorie des modèles généralistes lourds plutôt que des modèles compacts.

À sa sortie, DeepSeek-V3.2-Speciale se situait dans le top 25% des LLM de sa génération sur SWE-Bench Verified, un repère centré sur la résolution de tâches de développement logiciel. Les informations disponibles reposent sur deux sources concordantes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurDeepSeek
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie1 décembre 2025
Multimodalnon
Paramètres685 milliards
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
HMMT 202599,2 %3ᵉ / 33llm-statsAuto-déclaré
AIME 202596,0 %18ᵉ / 108llm-statsAuto-déclaré
CodeForces90,0 %3ᵉ / 16llm-statsAuto-déclaré
t2-bench80,3 %9ᵉ / 23llm-statsAuto-déclaré
SWE-Bench Verified73,1 %43ᵉ / 100llm-statsAuto-déclaré
Terminal-Bench 2.046,4 %37ᵉ / 48llm-statsAuto-déclaré
Toolathlon35,2 %20ᵉ / 23llm-statsAuto-déclaré
Humanity's Last Exam30,6 %38ᵉ / 86llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. DeepSeek-V3.2-Speciale se distingue d’abord par son statut open-weights sous licence MIT, qui autorise les usages commerciaux et facilite l’intégration dans des environnements contrôlés. Sa fenêtre de contexte de 131 072 tokens le rend adapté aux traitements de documents longs, aux bases de code étendues ou aux échanges nécessitant une forte continuité contextuelle. Sur SWE-Bench Verified (mesure de résolution de problèmes logiciels vérifiés), il figurait à sa sortie dans le haut du panier de sa génération, avec un classement dans le top 25% parmi 56 LLM comparables sur la même période.

Limites et points d'attention. Avec 685 milliards de paramètres, DeepSeek-V3.2-Speciale appartient aux modèles très volumineux, ce qui implique des contraintes d’infrastructure importantes pour l’hébergement, l’inférence et l’exploitation à grande échelle. Les données disponibles ne documentent pas d’autres benchmarks, ce qui limite l’évaluation publique de ses performances hors développement logiciel. La couverture repose sur deux sources concordantes, suffisantes pour établir les caractéristiques principales, mais trop limitée pour détailler finement ses comportements par domaine. Le modèle reste surtout pertinent pour des usages nécessitant poids ouverts, licence permissive, long contexte et bonnes capacités en tâches de code à son époque.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).