QWQ-Plus
QWQ-Plus est un LLM de Qwen sorti le 8 avril 2025. Avec environ un an d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, où les cycles de remplacement sont rapides et où les modèles de cette période peuvent être dépassés ou retirés des catalogues.
QWQ-Plus est un LLM de Qwen sorti le 8 avril 2025. Avec environ un an d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, où les cycles de remplacement sont rapides et où les modèles de cette période peuvent être dépassés ou retirés des catalogues.
Son intérêt principal tient à son positionnement lors de sa sortie : sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat, QWQ-Plus se situait dans le haut du panier des LLM de sa génération. La fiche sert donc surtout à comprendre la place qu’il occupait à son époque.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Date de sortie | 8 avril 2025 |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: GPQA diamond | 65,4 % | 65ᵉ / 132 | epoch | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Epoch: GPQA diamond
Notre analyse
Forces. QWQ-Plus a surtout marqué par son niveau relatif au moment de sa sortie. Sur GPQA diamond, qui évalue des questions scientifiques de niveau doctorat, il figurait dans le top 20% des LLM comparables publiés sur la même période. Ce résultat indique une capacité compétitive, pour sa génération, sur des tâches de raisonnement scientifique exigeantes plutôt que sur de simples questions générales. Son score le place toutefois au milieu du classement global disponible, ce qui nuance son statut : il était solide dans son contexte de lancement, sans dominer l’ensemble des modèles recensés.
Limites et points d'attention. QWQ-Plus doit être lu comme un modèle ancien. Environ un an après sa sortie, ses performances sont probablement largement dépassées par les modèles haut de gamme plus récents, et il peut ne plus être proposé activement par son éditeur. La couverture repose sur une seule source de données concordante, ce qui limite la profondeur de l’analyse disponible. Aucun chiffre vérifié n’est fourni ici sur son coût d’entraînement, son volume de calcul ou son architecture, ce qui empêche d’évaluer l’effort industriel derrière le modèle au-delà de son résultat sur GPQA diamond.
Sources des données : Epoch AI (epoch.ai), CC-BY-4.0.