Qwen3 VL 4B Instruct

Qwen3 VL 4B Instruct est un LLM de Qwen sorti le 22 septembre 2025, avec 4 milliards de paramètres et une licence Apache 2.0 qui autorise l’usage commercial en open-weights. Son principal trait distinctif est l’association d’un format compact, d’une très grande fenêtre de contexte de 262…

Qwen3 VL 4B Instruct est un LLM de Qwen sorti le 22 septembre 2025, avec 4 milliards de paramètres et une licence Apache 2.0 qui autorise l’usage commercial en open-weights. Son principal trait distinctif est l’association d’un format compact, d’une très grande fenêtre de contexte de 262 144 tokens et d’un positionnement tarifaire très économique.

Le modèle se place nettement sous les prix habituels des LLM comparables, avec une tarification annoncée 95% inférieure à la moyenne et environ 48.3 fois moins chère que les modèles frontière. À sa sortie, son classement sur MMLU-Pro le situait dans une zone compétitive de sa génération, sans le placer parmi les tout premiers modèles.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie22 septembre 2025
Multimodaloui
Paramètres4 milliards
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
DocVQAtest95,3 %7ᵉ / 11llm-statsAuto-déclaré
ScreenSpot94,0 %8ᵉ / 16llm-statsAuto-déclaré
OCRBench88,1 %11ᵉ / 22llm-statsAuto-déclaré
MMBench-V1.185,1 %13ᵉ / 18llm-statsAuto-déclaré
AI2D84,1 %25ᵉ / 32llm-statsAuto-déclaré
WritingBench82,5 %14ᵉ / 15llm-statsAuto-déclaré
IFEval82,3 %49ᵉ / 65llm-statsAuto-déclaré
MMLU-Redux81,5 %38ᵉ / 48llm-statsAuto-déclaré
InfoVQAtest80,3 %12ᵉ / 12llm-statsAuto-déclaré
MMLU77,2 %70ᵉ / 98llm-statsAuto-déclaré
CC-OCR76,2 %17ᵉ / 18llm-statsAuto-déclaré
CharXiv-D76,2 %15ᵉ / 16llm-statsAuto-déclaré
MLVU-M75,3 %6ᵉ / 8llm-statsAuto-déclaré
MathVista-Mini73,7 %18ᵉ / 23llm-statsAuto-déclaré
RealWorldQA70,9 %20ᵉ / 25llm-statsAuto-déclaré
MMStar69,8 %16ᵉ / 22llm-statsAuto-déclaré
MVBench68,9 %16ᵉ / 17llm-statsAuto-déclaré
MMMU (val)67,4 %8ᵉ / 11llm-statsAuto-déclaré
MMLU-Pro67,1 %90ᵉ / 125llm-statsAuto-déclaré
BLINK65,8 %10ᵉ / 13llm-statsAuto-déclaré
MuirBench63,8 %9ᵉ / 11llm-statsAuto-déclaré
OCRBench-V2 (en)63,7 %7ᵉ / 12llm-statsAuto-déclaré
BFCL-v363,3 %18ᵉ / 19llm-statsAuto-déclaré
Include61,4 %25ᵉ / 31llm-statsAuto-déclaré
LiveBench 2024112560,9 %14ᵉ / 14llm-statsAuto-déclaré
ScreenSpot Pro59,5 %14ᵉ / 23llm-statsAuto-déclaré
MMLU-ProX59,4 %26ᵉ / 32llm-statsAuto-déclaré
Hallusion Bench57,6 %14ᵉ / 16llm-statsAuto-déclaré
OCRBench-V2 (zh)57,6 %10ᵉ / 11llm-statsAuto-déclaré
LVBench56,2 %16ᵉ / 23llm-statsAuto-déclaré
VideoMMMU56,2 %26ᵉ / 26llm-statsAuto-déclaré
CharadesSTA55,5 %10ᵉ / 12llm-statsAuto-déclaré
MMMU-Pro53,2 %50ᵉ / 60llm-statsAuto-déclaré
MathVision51,6 %26ᵉ / 31llm-statsAuto-déclaré
ODinW48,2 %5ᵉ / 16llm-statsAuto-déclaré
SimpleQA48,0 %16ᵉ / 45llm-statsAuto-déclaré
AIME 202546,6 %99ᵉ / 108llm-statsAuto-déclaré
ERQA41,3 %21ᵉ / 22llm-statsAuto-déclaré
SuperGPQA40,3 %32ᵉ / 34llm-statsAuto-déclaré
CharXiv-R39,7 %42ᵉ / 42llm-statsAuto-déclaré
LiveCodeBench v637,9 %52ᵉ / 53llm-statsAuto-déclaré
HMMT2530,7 %25ᵉ / 25llm-statsAuto-déclaré
PolyMATH28,8 %21ᵉ / 23llm-statsAuto-déclaré
OSWorld26,2 %18ᵉ / 20llm-statsAuto-déclaré
MM-MT-Bench7,5 %16ᵉ / 17llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
deepinfra0,1 $0,6 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 95 % en dessous de la moyenne des LLM similaires, et 48,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. Qwen3 VL 4B Instruct se distingue surtout par son rapport coût-format : 4 milliards de paramètres, open-weights, usage commercial autorisé et prix d’entrée très bas. La fenêtre de contexte de 262 144 tokens constitue un avantage concret pour traiter de longs contenus dans un modèle compact. À sa sortie, son résultat sur MMLU-Pro, benchmark d’évaluation de connaissances et de raisonnement général, le plaçait dans les 64% les mieux classés parmi les LLM de la même période, ce qui indique un niveau exploitable pour sa catégorie sans relever du haut de gamme.

Limites et points d'attention. Son positionnement sur MMLU-Pro reste éloigné des meilleurs modèles de sa génération, ce qui limite son intérêt pour les tâches où la précision de raisonnement prime sur le coût. Le format 4B favorise l’économie, mais implique aussi une ambition plus restreinte que celle des modèles plus grands. La fiche repose sur une seule source de données concordante, ce qui invite à traiter les comparaisons avec prudence. Le modèle convient surtout aux usages où la licence ouverte, le très faible coût et le long contexte comptent davantage que les performances de premier plan.


Sources des données : LLM-Stats (llm-stats.com).