Qwen2.5 VL 7B Instruct
Qwen2.5 VL 7B Instruct est un LLM de Qwen publié le 26 janvier 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Avec 8 milliards de paramètres, il appartient à la famille des modèles compacts de sa période plutôt qu’aux modèles frontière.
Qwen2.5 VL 7B Instruct est un LLM de Qwen publié le 26 janvier 2025, avec des poids ouverts sous licence Apache 2.0 et un usage commercial autorisé. Avec 8 milliards de paramètres, il appartient à la famille des modèles compacts de sa période plutôt qu’aux modèles frontière.
Son ancienneté d’environ un an est importante à l’échelle de l’IA générative : le modèle doit être lu comme une référence de génération 2025, probablement dépassée par les sorties plus récentes. Sa fenêtre de contexte atteint 32 768 tokens et ses connaissances s’arrêtent au 30 juin 2024.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 26 janvier 2025 |
| Connaissances jusqu'à | 2024-06-30 |
| Multimodal | oui |
| Paramètres | 8 milliards |
| Fenêtre de contexte | 32 768 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| DocVQA | 95,7 % | 2ᵉ / 26 | llm-stats | Auto-déclaré |
| Android Control Low_EM | 91,4 % | 3ᵉ / 3 | llm-stats | Auto-déclaré |
| ChartQA | 87,3 % | 9ᵉ / 24 | llm-stats | Auto-déclaré |
| OCRBench | 86,4 % | 14ᵉ / 22 | llm-stats | Auto-déclaré |
| TextVQA | 84,9 % | 2ᵉ / 15 | llm-stats | Auto-déclaré |
| ScreenSpot | 84,7 % | 15ᵉ / 16 | llm-stats | Auto-déclaré |
| MMBench | 84,3 % | 5ᵉ / 9 | llm-stats | Auto-déclaré |
| InfoVQA | 82,6 % | 2ᵉ / 9 | llm-stats | Auto-déclaré |
| AITZ_EM | 81,9 % | 3ᵉ / 3 | llm-stats | Auto-déclaré |
| CC-OCR | 77,8 % | 13ᵉ / 18 | llm-stats | Auto-déclaré |
| VideoMME w sub. | 71,6 % | 9ᵉ / 9 | llm-stats | Auto-déclaré |
| MLVU | 70,2 % | 10ᵉ / 10 | llm-stats | Auto-déclaré |
| MVBench | 69,6 % | 13ᵉ / 17 | llm-stats | Auto-déclaré |
| MathVista-Mini | 68,2 % | 20ᵉ / 23 | llm-stats | Auto-déclaré |
| VideoMME w/o sub. | 65,1 % | 10ᵉ / 10 | llm-stats | Auto-déclaré |
| MMStar | 63,9 % | 19ᵉ / 22 | llm-stats | Auto-déclaré |
| MMT-Bench | 63,6 % | 1ᵉ / 4 | llm-stats | Auto-déclaré |
| Android Control High_EM | 60,1 % | 3ᵉ / 3 | llm-stats | Auto-déclaré |
| MMMU | 58,6 % | 47ᵉ / 61 | llm-stats | Auto-déclaré |
| LongVideoBench | 54,7 % | 4ᵉ / 4 | llm-stats | Auto-déclaré |
| Hallusion Bench | 52,9 % | 16ᵉ / 16 | llm-stats | Auto-déclaré |
| LVBench | 45,3 % | 21ᵉ / 23 | llm-stats | Auto-déclaré |
| CharadesSTA | 43,6 % | 12ᵉ / 12 | llm-stats | Auto-déclaré |
| MMMU-Pro | 38,3 % | 58ᵉ / 60 | llm-stats | Auto-déclaré |
| ScreenSpot Pro | 29,0 % | 23ᵉ / 23 | llm-stats | Auto-déclaré |
| AndroidWorld_SR | 25,5 % | 7ᵉ / 8 | llm-stats | Auto-déclaré |
| MathVision | 25,1 % | 30ᵉ / 31 | llm-stats | Auto-déclaré |
| MMBench-Video | 1,8 % | 3ᵉ / 3 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Qwen2.5 VL 7B Instruct se distingue d’abord par son statut open-weights, avec une licence Apache 2.0 qui autorise les usages commerciaux. Ce point en fait un modèle exploitable hors d’une API fermée, sous réserve d’une infrastructure adaptée. Sa taille de 8 milliards de paramètres le place dans une catégorie plus légère que les grands modèles haut de gamme de sa période, tout en conservant une fenêtre de contexte longue de 32 768 tokens. À sa sortie, l’intérêt principal tenait donc à la combinaison entre poids ouverts, licence permissive, format Instruct et contexte étendu.
Limites et points d'attention. Son âge constitue aujourd’hui le principal point faible : environ un an représente un cycle très long pour l’IA, et ses performances sont probablement largement dépassées par les modèles plus récents. Les informations disponibles ne fournissent aucun benchmark, aucun tarif comparatif, ni aucun chiffre d’entraînement en équivalent GPU H100 ou en dollars, ce qui empêche d’évaluer précisément son niveau technique au-delà de ses caractéristiques publiées. Le modèle peut aussi ne plus être proposé dans le catalogue actuel de l’éditeur. Sa coupure de connaissances au 30 juin 2024 limite enfin la couverture des événements, bibliothèques et pratiques apparus après cette date.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).