Qwen2.5 VL 32B Instruct
Qwen2.5 VL 32B Instruct est un modèle Qwen publié le 28 février 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine un format intermédiaire de 34 milliards de paramètres et une fenêtre de contexte très large de 128 000 tokens.
Qwen2.5 VL 32B Instruct est un modèle Qwen publié le 28 février 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Son positionnement combine un format intermédiaire de 34 milliards de paramètres et une fenêtre de contexte très large de 128 000 tokens.
Son ancienneté d’environ un an le place déjà dans une génération passée, un écart très long à l’échelle de l’IA. La fiche doit donc le lire comme un modèle de sa période, avec des connaissances arrêtées au 30 juin 2024, plutôt que comme une référence actuelle.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 28 février 2025 |
| Connaissances jusqu'à | 2024-06-30 |
| Multimodal | oui |
| Paramètres | 34 milliards |
| Fenêtre de contexte | 128 000 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| DocVQA | 94,8 % | 6ᵉ / 26 | llm-stats | Auto-déclaré |
| Android Control Low_EM | 93,3 % | 2ᵉ / 3 | llm-stats | Auto-déclaré |
| HumanEval | 91,5 % | 10ᵉ / 65 | llm-stats | Auto-déclaré |
| ScreenSpot | 88,5 % | 11ᵉ / 16 | llm-stats | Auto-déclaré |
| MBPP | 84,0 % | 7ᵉ / 33 | llm-stats | Auto-déclaré |
| InfoVQA | 83,4 % | 1ᵉ / 9 | llm-stats | Auto-déclaré |
| AITZ_EM | 83,1 % | 2ᵉ / 3 | llm-stats | Auto-déclaré |
| MATH | 82,2 % | 18ᵉ / 70 | llm-stats | Auto-déclaré |
| MMLU | 78,4 % | 68ᵉ / 98 | llm-stats | Auto-déclaré |
| VideoMME w sub. | 77,9 % | 7ᵉ / 9 | llm-stats | Auto-déclaré |
| CC-OCR | 77,1 % | 15ᵉ / 18 | llm-stats | Auto-déclaré |
| MathVista-Mini | 74,7 % | 17ᵉ / 23 | llm-stats | Auto-déclaré |
| VideoMME w/o sub. | 70,5 % | 9ᵉ / 10 | llm-stats | Auto-déclaré |
| MMMU | 70,0 % | 30ᵉ / 61 | llm-stats | Auto-déclaré |
| Android Control High_EM | 69,6 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| MMStar | 69,5 % | 17ᵉ / 22 | llm-stats | Auto-déclaré |
| MMLU-Pro | 68,8 % | 84ᵉ / 125 | llm-stats | Auto-déclaré |
| OCRBench-V2 (zh) | 59,1 % | 8ᵉ / 11 | llm-stats | Auto-déclaré |
| OCRBench-V2 (en) | 57,2 % | 12ᵉ / 12 | llm-stats | Auto-déclaré |
| CharadesSTA | 54,2 % | 11ᵉ / 12 | llm-stats | Auto-déclaré |
| MMMU-Pro | 49,5 % | 53ᵉ / 60 | llm-stats | Auto-déclaré |
| LVBench | 49,0 % | 19ᵉ / 23 | llm-stats | Auto-déclaré |
| GPQA | 46,0 % | 168ᵉ / 213 | llm-stats | Auto-déclaré |
| ScreenSpot Pro | 39,4 % | 22ᵉ / 23 | llm-stats | Auto-déclaré |
| MathVision | 38,4 % | 27ᵉ / 31 | llm-stats | Auto-déclaré |
| AndroidWorld_SR | 22,0 % | 8ᵉ / 8 | llm-stats | Auto-déclaré |
| OSWorld | 5,9 % | 20ᵉ / 20 | llm-stats | Auto-déclaré |
| MMBench-Video | 1,9 % | 2ᵉ / 3 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Vision | 1120 | 96ᵉ |
Notre analyse
Forces. Qwen2.5 VL 32B Instruct se distingue surtout par sa licence permissive, qui autorise les usages commerciaux avec des poids ouverts, et par sa grande fenêtre de contexte, utile pour traiter des entrées longues dans un cadre maîtrisé. À sa sortie, son résultat sur GPQA (benchmark de raisonnement scientifique avancé) le plaçait dans le top 56% des LLM de sa génération, ce qui indique un niveau exploitable pour l’époque sans le ranger parmi les modèles les plus sélectifs. La présence d’un score Arena vision apporte aussi un repère public sur ses capacités évaluées en contexte multimodal.
Limites et points d'attention. Son âge est le principal point faible : environ un an représente un cycle très long pour les modèles d’IA, et ses performances sont aujourd’hui probablement largement dépassées par les modèles haut de gamme plus récents. Son rang en Arena vision reste éloigné des premières places, ce qui limite son intérêt comme référence visuelle actuelle. Sa date de coupure des connaissances, fixée au 30 juin 2024, restreint aussi la fiabilité sur les événements et technologies postérieurs. Aucun chiffre vérifié de coût d’entraînement ou d’équivalent GPU H100 n’est disponible dans les données fournies.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai).