Qwen2.5-Omni-7B

Qwen2.5-Omni-7B est un LLM open-weights publié par Qwen le 27 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Avec 7 milliards de paramètres, 11 milliards de paramètres actifs indiqués et une fenêtre de contexte de 32 768 tokens, il s’inscrit dans la catégorie des…

Qwen2.5-Omni-7B est un LLM open-weights publié par Qwen le 27 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Avec 7 milliards de paramètres, 11 milliards de paramètres actifs indiqués et une fenêtre de contexte de 32 768 tokens, il s’inscrit dans la catégorie des modèles compacts de sa génération.

Son ancienneté d’environ un an est déjà importante à l’échelle de l’IA. La fiche le situe donc d’abord dans son contexte de sortie, où il figurait dans le top 92% sur GPQA parmi les LLM de la même période, plutôt que comme une référence actuelle.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie27 mars 2025
Multimodaloui
Paramètres7 milliards
Paramètres actifs11 milliards
Fenêtre de contexte32 768 tokens
Modalités (entrée → sortie)text,image,audio,video → embedding

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
FLEURS95,9 %1ᵉ / 6llm-statsAuto-déclaré
DocVQA95,2 %3ᵉ / 26llm-statsAuto-déclaré
GSM8k88,7 %29ᵉ / 47llm-statsAuto-déclaré
ChartQA85,3 %14ᵉ / 24llm-statsAuto-déclaré
TextVQA84,4 %3ᵉ / 15llm-statsAuto-déclaré
AI2D83,2 %26ᵉ / 32llm-statsAuto-déclaré
MMBench-V1.181,8 %15ᵉ / 18llm-statsAuto-déclaré
HumanEval78,7 %46ᵉ / 65llm-statsAuto-déclaré
MBPP73,2 %20ᵉ / 33llm-statsAuto-déclaré
VideoMME w sub.72,4 %8ᵉ / 9llm-statsAuto-déclaré
MATH71,5 %35ᵉ / 70llm-statsAuto-déclaré
MMLU-Redux71,0 %45ᵉ / 48llm-statsAuto-déclaré
MVBench70,3 %12ᵉ / 17llm-statsAuto-déclaré
RealWorldQA70,3 %21ᵉ / 25llm-statsAuto-déclaré
EgoSchema68,6 %7ᵉ / 9llm-statsAuto-déclaré
MathVista67,9 %19ᵉ / 38llm-statsAuto-déclaré
MultiPL-E65,8 %12ᵉ / 13llm-statsAuto-déclaré
MMStar64,0 %18ᵉ / 22llm-statsAuto-déclaré
MMMU59,2 %46ᵉ / 61llm-statsAuto-déclaré
MuirBench59,2 %11ᵉ / 11llm-statsAuto-déclaré
OCRBench_V257,8 %6ᵉ / 7llm-statsAuto-déclaré
MMLU-Pro47,0 %115ᵉ / 125llm-statsAuto-déclaré
ODinW42,4 %12ᵉ / 16llm-statsAuto-déclaré
MMMU-Pro36,6 %59ᵉ / 60llm-statsAuto-déclaré
GPQA30,8 %200ᵉ / 213llm-statsAuto-déclaré
LiveBench29,6 %38ᵉ / 38llm-statsAuto-déclaré
MathVision25,0 %31ᵉ / 31llm-statsAuto-déclaré
MM-MT-Bench6,0 %17ᵉ / 17llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Qwen2.5-Omni-7B conserve un intérêt comme modèle open-weights sous licence Apache 2.0, un cadre permissif qui autorise l’usage commercial et l’intégration dans des environnements maîtrisés. À sa sortie, son positionnement sur GPQA le plaçait dans le haut de sa génération parmi les modèles comparables de la période. Ses meilleurs résultats disponibles concernent MVEB Video-Only, qui mesure la qualité d’embeddings vidéo seuls sur des tâches de classification et de pair classification. Ce point suggère un profil plus convaincant sur l’analyse de signaux vidéo isolés que sur les évaluations combinant texte, vidéo et audio-visuel.

Limites et points d'attention. Qwen2.5-Omni-7B doit être lu comme un modèle daté. Un an d’ancienneté représente un écart très long dans le cycle actuel des LLM, et ses performances sont probablement largement dépassées par les modèles haut de gamme plus récents. Les résultats MVEB globaux et MVEB Video-Text restent nettement plus faibles que son score Video-Only, ce qui limite l’intérêt du modèle pour les usages nécessitant des embeddings robustes entre texte, vidéo et audio-visuel. La couverture repose sur deux sources concordantes, suffisante pour établir les caractéristiques principales, mais insuffisante pour documenter finement l’entraînement ou les coûts associés.


Sources des données : LLM-Stats (llm-stats.com) · MTEB — Massive Text Embedding Benchmark.