DeepSeek VL2 Small

DeepSeek VL2 Small est un modèle de DeepSeek publié le 13 décembre 2024, dans une version de 16 milliards de paramètres. Son nom le place dans une déclinaison « Small », avec un format nettement plus contenu que les très grands modèles généralistes de sa période.

DeepSeek VL2 Small est un modèle de DeepSeek publié le 13 décembre 2024, dans une version de 16 milliards de paramètres. Son nom le place dans une déclinaison « Small », avec un format nettement plus contenu que les très grands modèles généralistes de sa période.

Son ancienneté, proche de deux ans, est un point central : à l’échelle de l’IA générative, DeepSeek VL2 Small appartient déjà à une génération probablement dépassée. Sa licence DeepSeek indique aussi des poids non ouverts, ce qui limite l’examen indépendant et la réutilisation directe du modèle.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurDeepSeek
Licencedeepseek (poids non ouverts)
Date de sortie13 décembre 2024
Multimodaloui
Paramètres16 milliards

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
DocVQA92,3 %17ᵉ / 26llm-statsAuto-déclaré
ChartQA84,5 %15ᵉ / 24llm-statsAuto-déclaré
OCRBench83,4 %18ᵉ / 22llm-statsAuto-déclaré
TextVQA83,4 %5ᵉ / 15llm-statsAuto-déclaré
MMBench80,3 %7ᵉ / 9llm-statsAuto-déclaré
AI2D80,0 %29ᵉ / 32llm-statsAuto-déclaré
MMBench-V1.179,3 %16ᵉ / 18llm-statsAuto-déclaré
InfoVQA75,8 %4ᵉ / 9llm-statsAuto-déclaré
RealWorldQA65,4 %24ᵉ / 25llm-statsAuto-déclaré
MMT-Bench62,9 %3ᵉ / 4llm-statsAuto-déclaré
MathVista60,7 %26ᵉ / 38llm-statsAuto-déclaré
MMStar57,0 %21ᵉ / 22llm-statsAuto-déclaré
MMMU48,0 %57ᵉ / 61llm-statsAuto-déclaré
MME21,2 %2ᵉ / 3llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. DeepSeek VL2 Small conserve un intérêt documentaire comme modèle DeepSeek de fin 2024 au format 16 milliards de paramètres. À sa sortie, ce positionnement « Small » pouvait répondre à une logique de modèle plus compact que les modèles haut de gamme de la même période, avec un compromis attendu entre taille et coût d’exploitation. Les informations disponibles ne fournissent toutefois aucun benchmark, aucun indice et aucun détail d’entraînement permettant d’établir une supériorité mesurée sur des tâches précises.

Limites et points d'attention. Le modèle est ancien pour le secteur : environ deux ans représentent un cycle très long dans l’IA, et ses performances sont aujourd’hui probablement largement dépassées par les générations plus récentes. Il est aussi susceptible de ne plus être proposé activement par l’éditeur. La licence DeepSeek avec poids non ouverts réduit la transparence technique et limite les usages nécessitant audit, adaptation fine ou hébergement totalement maîtrisé. La fiche repose sur une seule source de données concordante, sans chiffres de benchmark ni coût d’entraînement vérifiable.


Sources des données : LLM-Stats (llm-stats.com).