DeepSeek VL2

DeepSeek VL2 est un LLM publié par DeepSeek le 13 décembre 2024. Avec une fenêtre de contexte de 129 280 tokens et 27 milliards de paramètres, il s’inscrivait dans la génération des modèles capables de traiter de longs contenus tout en restant sous le seuil des très grands modèles…

DeepSeek VL2 est un LLM publié par DeepSeek le 13 décembre 2024. Avec une fenêtre de contexte de 129 280 tokens et 27 milliards de paramètres, il s’inscrivait dans la génération des modèles capables de traiter de longs contenus tout en restant sous le seuil des très grands modèles généralistes.

Son ancienneté, environ deux ans à l’échelle actuelle de l’IA, le place désormais dans une catégorie historique plutôt que dans l’actualité des modèles haut de gamme. Sa licence DeepSeek indique des poids non ouverts, ce qui limite l’examen indépendant et les usages nécessitant un déploiement totalement maîtrisé.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurDeepSeek
Licencedeepseek (poids non ouverts)
Date de sortie13 décembre 2024
Multimodaloui
Paramètres27 milliards
Fenêtre de contexte129 280 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
DocVQA93,3 %11ᵉ / 26llm-statsAuto-déclaré
ChartQA86,0 %11ᵉ / 24llm-statsAuto-déclaré
TextVQA84,2 %4ᵉ / 15llm-statsAuto-déclaré
AI2D81,4 %28ᵉ / 32llm-statsAuto-déclaré
OCRBench81,1 %20ᵉ / 22llm-statsAuto-déclaré
MMBench79,6 %8ᵉ / 9llm-statsAuto-déclaré
MMBench-V1.179,2 %17ᵉ / 18llm-statsAuto-déclaré
InfoVQA78,1 %3ᵉ / 9llm-statsAuto-déclaré
RealWorldQA68,4 %23ᵉ / 25llm-statsAuto-déclaré
MMT-Bench63,6 %1ᵉ / 4llm-statsAuto-déclaré
MathVista62,8 %23ᵉ / 38llm-statsAuto-déclaré
MMStar61,3 %20ᵉ / 22llm-statsAuto-déclaré
MMMU51,1 %55ᵉ / 61llm-statsAuto-déclaré
MME22,5 %1ᵉ / 3llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, DeepSeek VL2 se distinguait surtout par sa grande fenêtre de contexte, utile pour ingérer des documents longs, maintenir des échanges étendus ou comparer plusieurs blocs de texte dans une même requête. Ses 27 milliards de paramètres le plaçaient dans une classe intermédiaire à grande échelle, plus substantielle que les petits modèles spécialisés, sans atteindre les formats les plus massifs. Le modèle reste aussi identifiable dans une lignée DeepSeek, ce qui donne un point de repère clair sur son origine et sa période de publication.

Limites et points d'attention. DeepSeek VL2 est ancien pour le marché de l’IA générative, ses performances sont aujourd’hui largement dépassées par les modèles frontière et il peut ne plus figurer dans les catalogues actifs de l’éditeur. Les poids non ouverts réduisent les possibilités d’audit, de reproduction et d’adaptation locale. La fiche repose sur une seule source de données concordante, ce qui limite la granularité disponible sur ses performances, son entraînement, son coût et ses usages réels. Aucun chiffre vérifié de benchmark, de compute ou de coût d’entraînement n’est disponible ici, ce qui impose une lecture prudente de son positionnement technique.


Sources des données : LLM-Stats (llm-stats.com).