DeepSeek-V3.2-Speciale
DeepSeek-V3.2-Speciale est un LLM de DeepSeek publié le 1 décembre 2025, sous licence MIT avec poids ouverts et usage commercial autorisé. Son positionnement combine une très grande taille de modèle et une fenêtre de contexte longue, ce qui le place dans la catégorie des modèles…
DeepSeek-V3.2-Speciale est un LLM de DeepSeek publié le 1 décembre 2025, sous licence MIT avec poids ouverts et usage commercial autorisé. Son positionnement combine une très grande taille de modèle et une fenêtre de contexte longue, ce qui le place dans la catégorie des modèles généralistes lourds plutôt que des modèles compacts.
À sa sortie, DeepSeek-V3.2-Speciale se situait dans le top 25% des LLM de sa génération sur SWE-Bench Verified, un repère centré sur la résolution de tâches de développement logiciel. Les informations disponibles reposent sur deux sources concordantes.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | DeepSeek |
| Licence | MIT (open-weights, usage commercial autorisé) |
| Date de sortie | 1 décembre 2025 |
| Multimodal | non |
| Paramètres | 685 milliards |
| Fenêtre de contexte | 131 072 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| HMMT 2025 | 99,2 % | 3ᵉ / 33 | llm-stats | Auto-déclaré |
| AIME 2025 | 96,0 % | 18ᵉ / 108 | llm-stats | Auto-déclaré |
| CodeForces | 90,0 % | 3ᵉ / 16 | llm-stats | Auto-déclaré |
| t2-bench | 80,3 % | 9ᵉ / 23 | llm-stats | Auto-déclaré |
| SWE-Bench Verified | 73,1 % | 43ᵉ / 100 | llm-stats | Auto-déclaré |
| Terminal-Bench 2.0 | 46,4 % | 37ᵉ / 48 | llm-stats | Auto-déclaré |
| Toolathlon | 35,2 % | 20ᵉ / 23 | llm-stats | Auto-déclaré |
| Humanity's Last Exam | 30,6 % | 38ᵉ / 86 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. DeepSeek-V3.2-Speciale se distingue d’abord par son statut open-weights sous licence MIT, qui autorise les usages commerciaux et facilite l’intégration dans des environnements contrôlés. Sa fenêtre de contexte de 131 072 tokens le rend adapté aux traitements de documents longs, aux bases de code étendues ou aux échanges nécessitant une forte continuité contextuelle. Sur SWE-Bench Verified (mesure de résolution de problèmes logiciels vérifiés), il figurait à sa sortie dans le haut du panier de sa génération, avec un classement dans le top 25% parmi 56 LLM comparables sur la même période.
Limites et points d'attention. Avec 685 milliards de paramètres, DeepSeek-V3.2-Speciale appartient aux modèles très volumineux, ce qui implique des contraintes d’infrastructure importantes pour l’hébergement, l’inférence et l’exploitation à grande échelle. Les données disponibles ne documentent pas d’autres benchmarks, ce qui limite l’évaluation publique de ses performances hors développement logiciel. La couverture repose sur deux sources concordantes, suffisantes pour établir les caractéristiques principales, mais trop limitée pour détailler finement ses comportements par domaine. Le modèle reste surtout pertinent pour des usages nécessitant poids ouverts, licence permissive, long contexte et bonnes capacités en tâches de code à son époque.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).