DeepSeek-V3.2
DeepSeek-V3.2 est un LLM open-weights de DeepSeek, publié le 1 décembre 2025 sous licence MIT avec usage commercial autorisé. Le modèle combine une très grande taille totale, 685 milliards de paramètres, avec 37 milliards de paramètres actifs, et une fenêtre de contexte de 163 840 tokens.
DeepSeek-V3.2 est un LLM open-weights de DeepSeek, publié le 1 décembre 2025 sous licence MIT avec usage commercial autorisé. Le modèle combine une très grande taille totale, 685 milliards de paramètres, avec 37 milliards de paramètres actifs, et une fenêtre de contexte de 163 840 tokens.
Son positionnement associe performances solides en mathématiques, raisonnement et questions scientifiques, avec un tarif très économique. La tarification se situe 88% sous la moyenne des LLM similaires et environ 21,1 fois sous celle des modèles frontière, ce qui en fait un modèle surtout notable par son rapport coût-performance.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | DeepSeek |
| Licence | MIT (open-weights, usage commercial autorisé) |
| Date de sortie | 1 décembre 2025 |
| Multimodal | non |
| Paramètres | 685 milliards |
| Paramètres actifs | 37 milliards |
| Fenêtre de contexte | 163 840 tokens |
| Modalités (entrée → sortie) | text → text |
Indices de synthèse
| Indice | Valeur | Rang (LLM) |
|---|---|---|
| Intelligence Index | 24.7 | 84ᵉ / 136 |
| Math Index | 59.0 | 26ᵉ / 55 |
Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: OTIS Mock AIME 2024-2025 | 87,8 % | 26ᵉ / 111 | epoch | ✅ Mesuré |
| LiveBench: Mathematics | 85,0 % | 20ᵉ / 76 | livebench | ✅ Mesuré |
| Epoch: GPQA diamond | 83,4 % | 37ᵉ / 132 | epoch | ✅ Mesuré |
| LiveBench: Reasoning | 77,2 % | 25ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Language | 70,4 % | 43ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Coding | 64,6 % | 65ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Global average | 62,2 % | 37ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Data Analysis | 50,0 % | 51ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: IF | 48,2 % | 46ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Agentic Coding | 40,0 % | 44ᵉ / 76 | livebench | ✅ Mesuré |
| Epoch: SimpleQA Verified | 27,5 % | 38ᵉ / 52 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-2025-02-28-Private | 22,1 % | 27ᵉ / 69 | epoch | ✅ Mesuré |
| Epoch: Chess Puzzles | 14,0 % | 35ᵉ / 43 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-Tier-4-2025-07-01-Private | 2,1 % | 37ᵉ / 55 | epoch | ✅ Mesuré |
| AIME 2025 | 93,1 % | 26ᵉ / 108 | llm-stats | Auto-déclaré |
| HMMT 2025 | 90,2 % | 17ᵉ / 33 | llm-stats | Auto-déclaré |
| MMLU-Pro | 85,0 % | 17ᵉ / 125 | llm-stats | Auto-déclaré |
| LiveCodeBench | 83,3 % | 3ᵉ / 72 | llm-stats | Auto-déclaré |
| GPQA | 82,4 % | 59ᵉ / 213 | llm-stats | Auto-déclaré |
| t2-bench | 80,3 % | 9ᵉ / 23 | llm-stats | Auto-déclaré |
| CodeForces | 79,5 % | 8ᵉ / 16 | llm-stats | Auto-déclaré |
| IMO-AnswerBench | 78,3 % | 18ᵉ / 18 | llm-stats | Auto-déclaré |
| SWE-Bench Verified | 73,1 % | 43ᵉ / 100 | llm-stats | Auto-déclaré |
| SWE-bench Multilingual | 70,2 % | 16ᵉ / 32 | llm-stats | Auto-déclaré |
| BrowseComp-zh | 65,0 % | 6ᵉ / 13 | llm-stats | Auto-déclaré |
| BrowseComp | 51,4 % | 35ᵉ / 51 | llm-stats | Auto-déclaré |
| Terminal-Bench 2.0 | 46,4 % | 37ᵉ / 48 | llm-stats | Auto-déclaré |
| Humanity's Last Exam | 40,8 % | 27ᵉ / 86 | llm-stats | Auto-déclaré |
| MCP-Mark | 38,0 % | 7ᵉ / 8 | llm-stats | Auto-déclaré |
| Toolathlon | 35,2 % | 20ᵉ / 23 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Intelligence Index
Math Index
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1425 | 81ᵉ |
| Arena Code | 1332 | 65ᵉ |
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| StreamLake | 0,2288 $ | 0,3432 $ | 0,02288 $ |
| artificialanalysis | 0,5 $ | 1,6 $ | 0,4 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 88 % en dessous de la moyenne des LLM similaires, et 21,1 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Notre analyse
Forces. DeepSeek-V3.2 ressort surtout sur les tâches quantitatives et scientifiques. OTIS Mock AIME 2024-2025 (olympiades de mathématiques niveau lycée) et LiveBench Mathematics le placent dans la partie haute des modèles évalués, tandis que GPQA diamond (questions scientifiques niveau doctorat) confirme un bon niveau sur les connaissances scientifiques complexes. À sa sortie, il figurait dans le top 14% des LLM de sa génération sur GPQA diamond, un signal solide pour situer son niveau à l’époque. LiveBench Reasoning indique aussi une bonne tenue en raisonnement. La licence MIT, l’ouverture des poids et le tarif très bas renforcent son intérêt pour des usages où le coût d’inférence, la liberté de déploiement et la transparence de distribution comptent fortement.
Limites et points d'attention. Le profil est moins convaincant en programmation, avec des résultats LiveBench Coding et Arena code nettement plus bas que ses résultats en mathématiques et en raisonnement. La compréhension du langage se situe davantage en milieu de tableau, et l’Intelligence Index global ne le place pas parmi les modèles les plus compétitifs toutes tâches confondues. Les scores Arena text et Arena code suggèrent aussi une réception comparative modérée face aux meilleurs modèles généralistes et de code. DeepSeek-V3.2 convient donc surtout aux cas où un modèle open-weights économique est recherché pour des tâches de mathématiques, de raisonnement ou de sciences, plutôt qu’à des usages centrés sur le code avancé ou la meilleure performance généraliste disponible.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.