Qwen

Qwen3 VL 4B Instruct

Qwen3 VL 4B Instruct est un LLM de Qwen sorti le 22 septembre 2025, avec 4 milliards de paramètres et une licence Apache 2.0 qui autorise l’usage commercial en open-weights. Son principal trait distinctif est l’association d’un format compact, d’une très grande fenêtre de contexte de 262…

Le modèle se place nettement sous les prix habituels des LLM comparables, avec une tarification annoncée 95% inférieure à la moyenne et environ 48.3 fois moins chère que les modèles frontière. À sa sortie, son classement sur MMLU-Pro le situait dans une zone compétitive de sa génération, sans le placer parmi les tout premiers modèles.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Qwen
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	22 septembre 2025
Multimodal	oui
Paramètres	4 milliards
Fenêtre de contexte	262 144 tokens
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
DocVQAtest	95,3 %	7ᵉ / 11	llm-stats	Auto-déclaré
ScreenSpot	94,0 %	8ᵉ / 16	llm-stats	Auto-déclaré
OCRBench	88,1 %	11ᵉ / 22	llm-stats	Auto-déclaré
MMBench-V1.1	85,1 %	13ᵉ / 18	llm-stats	Auto-déclaré
AI2D	84,1 %	25ᵉ / 32	llm-stats	Auto-déclaré
WritingBench	82,5 %	14ᵉ / 15	llm-stats	Auto-déclaré
IFEval	82,3 %	49ᵉ / 65	llm-stats	Auto-déclaré
MMLU-Redux	81,5 %	38ᵉ / 48	llm-stats	Auto-déclaré
InfoVQAtest	80,3 %	12ᵉ / 12	llm-stats	Auto-déclaré
MMLU	77,2 %	70ᵉ / 98	llm-stats	Auto-déclaré
CC-OCR	76,2 %	17ᵉ / 18	llm-stats	Auto-déclaré
CharXiv-D	76,2 %	15ᵉ / 16	llm-stats	Auto-déclaré
MLVU-M	75,3 %	6ᵉ / 8	llm-stats	Auto-déclaré
MathVista-Mini	73,7 %	18ᵉ / 23	llm-stats	Auto-déclaré
RealWorldQA	70,9 %	20ᵉ / 25	llm-stats	Auto-déclaré
MMStar	69,8 %	16ᵉ / 22	llm-stats	Auto-déclaré
MVBench	68,9 %	16ᵉ / 17	llm-stats	Auto-déclaré
MMMU (val)	67,4 %	8ᵉ / 11	llm-stats	Auto-déclaré
MMLU-Pro	67,1 %	90ᵉ / 125	llm-stats	Auto-déclaré
BLINK	65,8 %	10ᵉ / 13	llm-stats	Auto-déclaré
MuirBench	63,8 %	9ᵉ / 11	llm-stats	Auto-déclaré
OCRBench-V2 (en)	63,7 %	7ᵉ / 12	llm-stats	Auto-déclaré
BFCL-v3	63,3 %	18ᵉ / 19	llm-stats	Auto-déclaré
Include	61,4 %	25ᵉ / 31	llm-stats	Auto-déclaré
LiveBench 20241125	60,9 %	14ᵉ / 14	llm-stats	Auto-déclaré
ScreenSpot Pro	59,5 %	14ᵉ / 23	llm-stats	Auto-déclaré
MMLU-ProX	59,4 %	26ᵉ / 32	llm-stats	Auto-déclaré
Hallusion Bench	57,6 %	14ᵉ / 16	llm-stats	Auto-déclaré
OCRBench-V2 (zh)	57,6 %	10ᵉ / 11	llm-stats	Auto-déclaré
LVBench	56,2 %	16ᵉ / 23	llm-stats	Auto-déclaré
VideoMMMU	56,2 %	26ᵉ / 26	llm-stats	Auto-déclaré
CharadesSTA	55,5 %	10ᵉ / 12	llm-stats	Auto-déclaré
MMMU-Pro	53,2 %	50ᵉ / 60	llm-stats	Auto-déclaré
MathVision	51,6 %	26ᵉ / 31	llm-stats	Auto-déclaré
ODinW	48,2 %	5ᵉ / 16	llm-stats	Auto-déclaré
SimpleQA	48,0 %	16ᵉ / 45	llm-stats	Auto-déclaré
AIME 2025	46,6 %	99ᵉ / 108	llm-stats	Auto-déclaré
ERQA	41,3 %	21ᵉ / 22	llm-stats	Auto-déclaré
SuperGPQA	40,3 %	32ᵉ / 34	llm-stats	Auto-déclaré
CharXiv-R	39,7 %	42ᵉ / 42	llm-stats	Auto-déclaré
LiveCodeBench v6	37,9 %	52ᵉ / 53	llm-stats	Auto-déclaré
HMMT25	30,7 %	25ᵉ / 25	llm-stats	Auto-déclaré
PolyMATH	28,8 %	21ᵉ / 23	llm-stats	Auto-déclaré
OSWorld	26,2 %	18ᵉ / 20	llm-stats	Auto-déclaré
MM-MT-Bench	7,5 %	16ᵉ / 17	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
deepinfra	0,1 $	0,6 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 95 % en dessous de la moyenne des LLM similaires, et 48,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. Qwen3 VL 4B Instruct se distingue surtout par son rapport coût-format : 4 milliards de paramètres, open-weights, usage commercial autorisé et prix d’entrée très bas. La fenêtre de contexte de 262 144 tokens constitue un avantage concret pour traiter de longs contenus dans un modèle compact. À sa sortie, son résultat sur MMLU-Pro, benchmark d’évaluation de connaissances et de raisonnement général, le plaçait dans les 64% les mieux classés parmi les LLM de la même période, ce qui indique un niveau exploitable pour sa catégorie sans relever du haut de gamme.

Limites et points d'attention. Son positionnement sur MMLU-Pro reste éloigné des meilleurs modèles de sa génération, ce qui limite son intérêt pour les tâches où la précision de raisonnement prime sur le coût. Le format 4B favorise l’économie, mais implique aussi une ambition plus restreinte que celle des modèles plus grands. La fiche repose sur une seule source de données concordante, ce qui invite à traiter les comparaisons avec prudence. Le modèle convient surtout aux usages où la licence ouverte, le très faible coût et le long contexte comptent davantage que les performances de premier plan.

Sources des données : LLM-Stats (llm-stats.com).

Qwen3 VL 4B Instruct

Caractéristiques

Performances (benchmarks)

Tarifs

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast