Qwen3 VL 4B Instruct
Qwen3 VL 4B Instruct est un LLM de Qwen sorti le 22 septembre 2025, avec 4 milliards de paramètres et une licence Apache 2.0 qui autorise l’usage commercial en open-weights. Son principal trait distinctif est l’association d’un format compact, d’une très grande fenêtre de contexte de 262…
Qwen3 VL 4B Instruct est un LLM de Qwen sorti le 22 septembre 2025, avec 4 milliards de paramètres et une licence Apache 2.0 qui autorise l’usage commercial en open-weights. Son principal trait distinctif est l’association d’un format compact, d’une très grande fenêtre de contexte de 262 144 tokens et d’un positionnement tarifaire très économique.
Le modèle se place nettement sous les prix habituels des LLM comparables, avec une tarification annoncée 95% inférieure à la moyenne et environ 48.3 fois moins chère que les modèles frontière. À sa sortie, son classement sur MMLU-Pro le situait dans une zone compétitive de sa génération, sans le placer parmi les tout premiers modèles.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 22 septembre 2025 |
| Multimodal | oui |
| Paramètres | 4 milliards |
| Fenêtre de contexte | 262 144 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| DocVQAtest | 95,3 % | 7ᵉ / 11 | llm-stats | Auto-déclaré |
| ScreenSpot | 94,0 % | 8ᵉ / 16 | llm-stats | Auto-déclaré |
| OCRBench | 88,1 % | 11ᵉ / 22 | llm-stats | Auto-déclaré |
| MMBench-V1.1 | 85,1 % | 13ᵉ / 18 | llm-stats | Auto-déclaré |
| AI2D | 84,1 % | 25ᵉ / 32 | llm-stats | Auto-déclaré |
| WritingBench | 82,5 % | 14ᵉ / 15 | llm-stats | Auto-déclaré |
| IFEval | 82,3 % | 49ᵉ / 65 | llm-stats | Auto-déclaré |
| MMLU-Redux | 81,5 % | 38ᵉ / 48 | llm-stats | Auto-déclaré |
| InfoVQAtest | 80,3 % | 12ᵉ / 12 | llm-stats | Auto-déclaré |
| MMLU | 77,2 % | 70ᵉ / 98 | llm-stats | Auto-déclaré |
| CC-OCR | 76,2 % | 17ᵉ / 18 | llm-stats | Auto-déclaré |
| CharXiv-D | 76,2 % | 15ᵉ / 16 | llm-stats | Auto-déclaré |
| MLVU-M | 75,3 % | 6ᵉ / 8 | llm-stats | Auto-déclaré |
| MathVista-Mini | 73,7 % | 18ᵉ / 23 | llm-stats | Auto-déclaré |
| RealWorldQA | 70,9 % | 20ᵉ / 25 | llm-stats | Auto-déclaré |
| MMStar | 69,8 % | 16ᵉ / 22 | llm-stats | Auto-déclaré |
| MVBench | 68,9 % | 16ᵉ / 17 | llm-stats | Auto-déclaré |
| MMMU (val) | 67,4 % | 8ᵉ / 11 | llm-stats | Auto-déclaré |
| MMLU-Pro | 67,1 % | 90ᵉ / 125 | llm-stats | Auto-déclaré |
| BLINK | 65,8 % | 10ᵉ / 13 | llm-stats | Auto-déclaré |
| MuirBench | 63,8 % | 9ᵉ / 11 | llm-stats | Auto-déclaré |
| OCRBench-V2 (en) | 63,7 % | 7ᵉ / 12 | llm-stats | Auto-déclaré |
| BFCL-v3 | 63,3 % | 18ᵉ / 19 | llm-stats | Auto-déclaré |
| Include | 61,4 % | 25ᵉ / 31 | llm-stats | Auto-déclaré |
| LiveBench 20241125 | 60,9 % | 14ᵉ / 14 | llm-stats | Auto-déclaré |
| ScreenSpot Pro | 59,5 % | 14ᵉ / 23 | llm-stats | Auto-déclaré |
| MMLU-ProX | 59,4 % | 26ᵉ / 32 | llm-stats | Auto-déclaré |
| Hallusion Bench | 57,6 % | 14ᵉ / 16 | llm-stats | Auto-déclaré |
| OCRBench-V2 (zh) | 57,6 % | 10ᵉ / 11 | llm-stats | Auto-déclaré |
| LVBench | 56,2 % | 16ᵉ / 23 | llm-stats | Auto-déclaré |
| VideoMMMU | 56,2 % | 26ᵉ / 26 | llm-stats | Auto-déclaré |
| CharadesSTA | 55,5 % | 10ᵉ / 12 | llm-stats | Auto-déclaré |
| MMMU-Pro | 53,2 % | 50ᵉ / 60 | llm-stats | Auto-déclaré |
| MathVision | 51,6 % | 26ᵉ / 31 | llm-stats | Auto-déclaré |
| ODinW | 48,2 % | 5ᵉ / 16 | llm-stats | Auto-déclaré |
| SimpleQA | 48,0 % | 16ᵉ / 45 | llm-stats | Auto-déclaré |
| AIME 2025 | 46,6 % | 99ᵉ / 108 | llm-stats | Auto-déclaré |
| ERQA | 41,3 % | 21ᵉ / 22 | llm-stats | Auto-déclaré |
| SuperGPQA | 40,3 % | 32ᵉ / 34 | llm-stats | Auto-déclaré |
| CharXiv-R | 39,7 % | 42ᵉ / 42 | llm-stats | Auto-déclaré |
| LiveCodeBench v6 | 37,9 % | 52ᵉ / 53 | llm-stats | Auto-déclaré |
| HMMT25 | 30,7 % | 25ᵉ / 25 | llm-stats | Auto-déclaré |
| PolyMATH | 28,8 % | 21ᵉ / 23 | llm-stats | Auto-déclaré |
| OSWorld | 26,2 % | 18ᵉ / 20 | llm-stats | Auto-déclaré |
| MM-MT-Bench | 7,5 % | 16ᵉ / 17 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| deepinfra | 0,1 $ | 0,6 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 95 % en dessous de la moyenne des LLM similaires, et 48,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Notre analyse
Forces. Qwen3 VL 4B Instruct se distingue surtout par son rapport coût-format : 4 milliards de paramètres, open-weights, usage commercial autorisé et prix d’entrée très bas. La fenêtre de contexte de 262 144 tokens constitue un avantage concret pour traiter de longs contenus dans un modèle compact. À sa sortie, son résultat sur MMLU-Pro, benchmark d’évaluation de connaissances et de raisonnement général, le plaçait dans les 64% les mieux classés parmi les LLM de la même période, ce qui indique un niveau exploitable pour sa catégorie sans relever du haut de gamme.
Limites et points d'attention. Son positionnement sur MMLU-Pro reste éloigné des meilleurs modèles de sa génération, ce qui limite son intérêt pour les tâches où la précision de raisonnement prime sur le coût. Le format 4B favorise l’économie, mais implique aussi une ambition plus restreinte que celle des modèles plus grands. La fiche repose sur une seule source de données concordante, ce qui invite à traiter les comparaisons avec prudence. Le modèle convient surtout aux usages où la licence ouverte, le très faible coût et le long contexte comptent davantage que les performances de premier plan.
Sources des données : LLM-Stats (llm-stats.com).