Qwen3 VL 30B A3B Instruct
Qwen3 VL 30B A3B Instruct est un LLM de Qwen publié le 22 septembre 2025, sous licence Apache 2.0 avec poids ouverts et usage commercial autorisé. Le modèle compte 31 milliards de paramètres et s'inscrit dans une logique de diffusion ouverte, avec une fenêtre de contexte très large de…
Qwen3 VL 30B A3B Instruct est un LLM de Qwen publié le 22 septembre 2025, sous licence Apache 2.0 avec poids ouverts et usage commercial autorisé. Le modèle compte 31 milliards de paramètres et s'inscrit dans une logique de diffusion ouverte, avec une fenêtre de contexte très large de 262 144 tokens.
Son positionnement le plus saillant est économique : son tarif minimal est 93% inférieur à la moyenne des LLM similaires et environ 37,2 fois moins cher que les modèles frontière. À sa sortie, il se situait dans le top 38% des LLM de sa génération sur GPQA.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 22 septembre 2025 |
| Connaissances jusqu'à | 2025-03-31 |
| Multimodal | oui |
| Paramètres | 31 milliards |
| Fenêtre de contexte | 262 144 tokens |
| Modalités (entrée → sortie) | text,image,video → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| DocVQAtest | 95,0 % | 9ᵉ / 11 | llm-stats | Auto-déclaré |
| ScreenSpot | 94,7 % | 5ᵉ / 16 | llm-stats | Auto-déclaré |
| OCRBench | 90,3 % | 5ᵉ / 22 | llm-stats | Auto-déclaré |
| MMLU-Redux | 88,4 % | 30ᵉ / 48 | llm-stats | Auto-déclaré |
| MMBench-V1.1 | 87,0 % | 11ᵉ / 18 | llm-stats | Auto-déclaré |
| IFEval | 85,8 % | 37ᵉ / 65 | llm-stats | Auto-déclaré |
| CharXiv-D | 85,5 % | 11ᵉ / 16 | llm-stats | Auto-déclaré |
| AI2D | 85,0 % | 20ᵉ / 32 | llm-stats | Auto-déclaré |
| MMLU | 85,0 % | 42ᵉ / 98 | llm-stats | Auto-déclaré |
| Creative Writing v3 | 84,6 % | 8ᵉ / 12 | llm-stats | Auto-déclaré |
| WritingBench | 82,6 % | 13ᵉ / 15 | llm-stats | Auto-déclaré |
| InfoVQAtest | 82,0 % | 11ᵉ / 12 | llm-stats | Auto-déclaré |
| MLVU-M | 81,3 % | 2ᵉ / 8 | llm-stats | Auto-déclaré |
| CC-OCR | 80,7 % | 8ᵉ / 18 | llm-stats | Auto-déclaré |
| MathVista-Mini | 80,1 % | 13ᵉ / 23 | llm-stats | Auto-déclaré |
| MMLU-Pro | 77,8 % | 59ᵉ / 125 | llm-stats | Auto-déclaré |
| Video-MME | 74,5 % | 12ᵉ / 17 | llm-stats | Auto-déclaré |
| MMMU (val) | 74,2 % | 4ᵉ / 11 | llm-stats | Auto-déclaré |
| RealWorldQA | 73,7 % | 16ᵉ / 25 | llm-stats | Auto-déclaré |
| MVBench | 72,3 % | 9ᵉ / 17 | llm-stats | Auto-déclaré |
| MMStar | 72,1 % | 13ᵉ / 22 | llm-stats | Auto-déclaré |
| Include | 71,6 % | 20ᵉ / 31 | llm-stats | Auto-déclaré |
| MMLU-ProX | 70,9 % | 21ᵉ / 32 | llm-stats | Auto-déclaré |
| GPQA | 70,4 % | 111ᵉ / 213 | llm-stats | Auto-déclaré |
| AIME 2025 | 69,3 % | 85ᵉ / 108 | llm-stats | Auto-déclaré |
| VideoMMMU | 68,7 % | 23ᵉ / 26 | llm-stats | Auto-déclaré |
| BLINK | 67,7 % | 7ᵉ / 13 | llm-stats | Auto-déclaré |
| BFCL-v3 | 66,3 % | 16ᵉ / 19 | llm-stats | Auto-déclaré |
| Multi-IF | 66,1 % | 18ᵉ / 20 | llm-stats | Auto-déclaré |
| LiveBench 20241125 | 65,4 % | 12ᵉ / 14 | llm-stats | Auto-déclaré |
| CharadesSTA | 63,5 % | 2ᵉ / 12 | llm-stats | Auto-déclaré |
| OCRBench-V2 (en) | 63,2 % | 8ᵉ / 12 | llm-stats | Auto-déclaré |
| MuirBench | 62,9 % | 10ᵉ / 11 | llm-stats | Auto-déclaré |
| LVBench | 62,5 % | 13ᵉ / 23 | llm-stats | Auto-déclaré |
| Hallusion Bench | 61,5 % | 12ᵉ / 16 | llm-stats | Auto-déclaré |
| ScreenSpot Pro | 60,5 % | 13ᵉ / 23 | llm-stats | Auto-déclaré |
| MMMU-Pro | 60,4 % | 42ᵉ / 60 | llm-stats | Auto-déclaré |
| MathVision | 60,2 % | 21ᵉ / 31 | llm-stats | Auto-déclaré |
| Arena-Hard v2 | 58,5 % | 12ᵉ / 16 | llm-stats | Auto-déclaré |
| OCRBench-V2 (zh) | 57,8 % | 9ᵉ / 11 | llm-stats | Auto-déclaré |
| SuperGPQA | 53,1 % | 25ᵉ / 34 | llm-stats | Auto-déclaré |
| HMMT25 | 50,6 % | 23ᵉ / 25 | llm-stats | Auto-déclaré |
| CharXiv-R | 48,9 % | 39ᵉ / 42 | llm-stats | Auto-déclaré |
| ODinW | 47,5 % | 6ᵉ / 16 | llm-stats | Auto-déclaré |
| PolyMATH | 44,3 % | 18ᵉ / 23 | llm-stats | Auto-déclaré |
| ERQA | 43,0 % | 20ᵉ / 22 | llm-stats | Auto-déclaré |
| LiveCodeBench v6 | 42,6 % | 49ᵉ / 53 | llm-stats | Auto-déclaré |
| OSWorld | 30,3 % | 17ᵉ / 20 | llm-stats | Auto-déclaré |
| SimpleQA | 27,0 % | 26ᵉ / 45 | llm-stats | Auto-déclaré |
| MM-MT-Bench | 8,1 % | 9ᵉ / 17 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Alibaba Cloud Int. | 0,13 $ | 0,52 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 93 % en dessous de la moyenne des LLM similaires, et 37,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Notre analyse
Forces. Qwen3 VL 30B A3B Instruct combine trois atouts concrets : poids ouverts, licence commerciale permissive et coût d’usage très bas. Cette combinaison le rend pertinent dans des contextes où la maîtrise du déploiement, du budget et des conditions d’exploitation compte autant que la performance brute. Sa fenêtre de contexte de 262 144 tokens le place dans la catégorie des modèles capables de traiter de très longs prompts ou ensembles de documents. À sa sortie, son résultat sur GPQA le plaçait dans le top 38% des LLM de la même période, un niveau solide sans relever du tout premier rang.
Limites et points d'attention. Le modèle n’est pas présenté comme un modèle frontière : son classement GPQA indique une performance honorable à sa sortie, mais pas dominante face aux meilleurs LLM de sa génération. La date de coupure des connaissances, fixée au 2025-03-31, limite la couverture native des événements et informations postérieurs. La comparaison tarifaire repose sur un tarif minimal d’entrée et de sortie, qui ne résume pas les coûts réels selon l’hébergement, le volume ou l’intégration. Les données disponibles sont concordantes mais limitées à 2 sources. Il convient aux usages où le coût, la licence ouverte, la longue fenêtre de contexte et un niveau généraliste solide priment sur la performance maximale.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).