Qwen3 VL 30B A3B Instruct

Qwen3 VL 30B A3B Instruct est un LLM de Qwen publié le 22 septembre 2025, sous licence Apache 2.0 avec poids ouverts et usage commercial autorisé. Le modèle compte 31 milliards de paramètres et s'inscrit dans une logique de diffusion ouverte, avec une fenêtre de contexte très large de…

Qwen3 VL 30B A3B Instruct est un LLM de Qwen publié le 22 septembre 2025, sous licence Apache 2.0 avec poids ouverts et usage commercial autorisé. Le modèle compte 31 milliards de paramètres et s'inscrit dans une logique de diffusion ouverte, avec une fenêtre de contexte très large de 262 144 tokens.

Son positionnement le plus saillant est économique : son tarif minimal est 93% inférieur à la moyenne des LLM similaires et environ 37,2 fois moins cher que les modèles frontière. À sa sortie, il se situait dans le top 38% des LLM de sa génération sur GPQA.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie22 septembre 2025
Connaissances jusqu'à2025-03-31
Multimodaloui
Paramètres31 milliards
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text,image,video → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
DocVQAtest95,0 %9ᵉ / 11llm-statsAuto-déclaré
ScreenSpot94,7 %5ᵉ / 16llm-statsAuto-déclaré
OCRBench90,3 %5ᵉ / 22llm-statsAuto-déclaré
MMLU-Redux88,4 %30ᵉ / 48llm-statsAuto-déclaré
MMBench-V1.187,0 %11ᵉ / 18llm-statsAuto-déclaré
IFEval85,8 %37ᵉ / 65llm-statsAuto-déclaré
CharXiv-D85,5 %11ᵉ / 16llm-statsAuto-déclaré
AI2D85,0 %20ᵉ / 32llm-statsAuto-déclaré
MMLU85,0 %42ᵉ / 98llm-statsAuto-déclaré
Creative Writing v384,6 %8ᵉ / 12llm-statsAuto-déclaré
WritingBench82,6 %13ᵉ / 15llm-statsAuto-déclaré
InfoVQAtest82,0 %11ᵉ / 12llm-statsAuto-déclaré
MLVU-M81,3 %2ᵉ / 8llm-statsAuto-déclaré
CC-OCR80,7 %8ᵉ / 18llm-statsAuto-déclaré
MathVista-Mini80,1 %13ᵉ / 23llm-statsAuto-déclaré
MMLU-Pro77,8 %59ᵉ / 125llm-statsAuto-déclaré
Video-MME74,5 %12ᵉ / 17llm-statsAuto-déclaré
MMMU (val)74,2 %4ᵉ / 11llm-statsAuto-déclaré
RealWorldQA73,7 %16ᵉ / 25llm-statsAuto-déclaré
MVBench72,3 %9ᵉ / 17llm-statsAuto-déclaré
MMStar72,1 %13ᵉ / 22llm-statsAuto-déclaré
Include71,6 %20ᵉ / 31llm-statsAuto-déclaré
MMLU-ProX70,9 %21ᵉ / 32llm-statsAuto-déclaré
GPQA70,4 %111ᵉ / 213llm-statsAuto-déclaré
AIME 202569,3 %85ᵉ / 108llm-statsAuto-déclaré
VideoMMMU68,7 %23ᵉ / 26llm-statsAuto-déclaré
BLINK67,7 %7ᵉ / 13llm-statsAuto-déclaré
BFCL-v366,3 %16ᵉ / 19llm-statsAuto-déclaré
Multi-IF66,1 %18ᵉ / 20llm-statsAuto-déclaré
LiveBench 2024112565,4 %12ᵉ / 14llm-statsAuto-déclaré
CharadesSTA63,5 %2ᵉ / 12llm-statsAuto-déclaré
OCRBench-V2 (en)63,2 %8ᵉ / 12llm-statsAuto-déclaré
MuirBench62,9 %10ᵉ / 11llm-statsAuto-déclaré
LVBench62,5 %13ᵉ / 23llm-statsAuto-déclaré
Hallusion Bench61,5 %12ᵉ / 16llm-statsAuto-déclaré
ScreenSpot Pro60,5 %13ᵉ / 23llm-statsAuto-déclaré
MMMU-Pro60,4 %42ᵉ / 60llm-statsAuto-déclaré
MathVision60,2 %21ᵉ / 31llm-statsAuto-déclaré
Arena-Hard v258,5 %12ᵉ / 16llm-statsAuto-déclaré
OCRBench-V2 (zh)57,8 %9ᵉ / 11llm-statsAuto-déclaré
SuperGPQA53,1 %25ᵉ / 34llm-statsAuto-déclaré
HMMT2550,6 %23ᵉ / 25llm-statsAuto-déclaré
CharXiv-R48,9 %39ᵉ / 42llm-statsAuto-déclaré
ODinW47,5 %6ᵉ / 16llm-statsAuto-déclaré
PolyMATH44,3 %18ᵉ / 23llm-statsAuto-déclaré
ERQA43,0 %20ᵉ / 22llm-statsAuto-déclaré
LiveCodeBench v642,6 %49ᵉ / 53llm-statsAuto-déclaré
OSWorld30,3 %17ᵉ / 20llm-statsAuto-déclaré
SimpleQA27,0 %26ᵉ / 45llm-statsAuto-déclaré
MM-MT-Bench8,1 %9ᵉ / 17llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Alibaba Cloud Int.0,13 $0,52 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 93 % en dessous de la moyenne des LLM similaires, et 37,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. Qwen3 VL 30B A3B Instruct combine trois atouts concrets : poids ouverts, licence commerciale permissive et coût d’usage très bas. Cette combinaison le rend pertinent dans des contextes où la maîtrise du déploiement, du budget et des conditions d’exploitation compte autant que la performance brute. Sa fenêtre de contexte de 262 144 tokens le place dans la catégorie des modèles capables de traiter de très longs prompts ou ensembles de documents. À sa sortie, son résultat sur GPQA le plaçait dans le top 38% des LLM de la même période, un niveau solide sans relever du tout premier rang.

Limites et points d'attention. Le modèle n’est pas présenté comme un modèle frontière : son classement GPQA indique une performance honorable à sa sortie, mais pas dominante face aux meilleurs LLM de sa génération. La date de coupure des connaissances, fixée au 2025-03-31, limite la couverture native des événements et informations postérieurs. La comparaison tarifaire repose sur un tarif minimal d’entrée et de sortie, qui ne résume pas les coûts réels selon l’hébergement, le volume ou l’intégration. Les données disponibles sont concordantes mais limitées à 2 sources. Il convient aux usages où le coût, la licence ouverte, la longue fenêtre de contexte et un niveau généraliste solide priment sur la performance maximale.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).