DeepSeek VL2
DeepSeek VL2 est un LLM publié par DeepSeek le 13 décembre 2024. Avec une fenêtre de contexte de 129 280 tokens et 27 milliards de paramètres, il s’inscrivait dans la génération des modèles capables de traiter de longs contenus tout en restant sous le seuil des très grands modèles…
DeepSeek VL2 est un LLM publié par DeepSeek le 13 décembre 2024. Avec une fenêtre de contexte de 129 280 tokens et 27 milliards de paramètres, il s’inscrivait dans la génération des modèles capables de traiter de longs contenus tout en restant sous le seuil des très grands modèles généralistes.
Son ancienneté, environ deux ans à l’échelle actuelle de l’IA, le place désormais dans une catégorie historique plutôt que dans l’actualité des modèles haut de gamme. Sa licence DeepSeek indique des poids non ouverts, ce qui limite l’examen indépendant et les usages nécessitant un déploiement totalement maîtrisé.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | DeepSeek |
| Licence | deepseek (poids non ouverts) |
| Date de sortie | 13 décembre 2024 |
| Multimodal | oui |
| Paramètres | 27 milliards |
| Fenêtre de contexte | 129 280 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| DocVQA | 93,3 % | 11ᵉ / 26 | llm-stats | Auto-déclaré |
| ChartQA | 86,0 % | 11ᵉ / 24 | llm-stats | Auto-déclaré |
| TextVQA | 84,2 % | 4ᵉ / 15 | llm-stats | Auto-déclaré |
| AI2D | 81,4 % | 28ᵉ / 32 | llm-stats | Auto-déclaré |
| OCRBench | 81,1 % | 20ᵉ / 22 | llm-stats | Auto-déclaré |
| MMBench | 79,6 % | 8ᵉ / 9 | llm-stats | Auto-déclaré |
| MMBench-V1.1 | 79,2 % | 17ᵉ / 18 | llm-stats | Auto-déclaré |
| InfoVQA | 78,1 % | 3ᵉ / 9 | llm-stats | Auto-déclaré |
| RealWorldQA | 68,4 % | 23ᵉ / 25 | llm-stats | Auto-déclaré |
| MMT-Bench | 63,6 % | 1ᵉ / 4 | llm-stats | Auto-déclaré |
| MathVista | 62,8 % | 23ᵉ / 38 | llm-stats | Auto-déclaré |
| MMStar | 61,3 % | 20ᵉ / 22 | llm-stats | Auto-déclaré |
| MMMU | 51,1 % | 55ᵉ / 61 | llm-stats | Auto-déclaré |
| MME | 22,5 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. À sa sortie, DeepSeek VL2 se distinguait surtout par sa grande fenêtre de contexte, utile pour ingérer des documents longs, maintenir des échanges étendus ou comparer plusieurs blocs de texte dans une même requête. Ses 27 milliards de paramètres le plaçaient dans une classe intermédiaire à grande échelle, plus substantielle que les petits modèles spécialisés, sans atteindre les formats les plus massifs. Le modèle reste aussi identifiable dans une lignée DeepSeek, ce qui donne un point de repère clair sur son origine et sa période de publication.
Limites et points d'attention. DeepSeek VL2 est ancien pour le marché de l’IA générative, ses performances sont aujourd’hui largement dépassées par les modèles frontière et il peut ne plus figurer dans les catalogues actifs de l’éditeur. Les poids non ouverts réduisent les possibilités d’audit, de reproduction et d’adaptation locale. La fiche repose sur une seule source de données concordante, ce qui limite la granularité disponible sur ses performances, son entraînement, son coût et ses usages réels. Aucun chiffre vérifié de benchmark, de compute ou de coût d’entraînement n’est disponible ici, ce qui impose une lecture prudente de son positionnement technique.
Sources des données : LLM-Stats (llm-stats.com).