QwQ-32B

QwQ-32B est un LLM open-weights de Qwen, publié le 5 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Son ancienneté d’environ un an est déjà très longue à l’échelle de l’IA, ce qui le situe surtout comme un modèle de sa génération plutôt que comme une référence actuelle.

QwQ-32B est un LLM open-weights de Qwen, publié le 5 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Son ancienneté d’environ un an est déjà très longue à l’échelle de l’IA, ce qui le situe surtout comme un modèle de sa génération plutôt que comme une référence actuelle.

Le modèle compte 32 milliards de paramètres et accepte 131 072 tokens de contexte, un format notable pour traiter de longs échanges ou documents. Son entraînement déclaré atteint 3,5 × 10²⁴ FLOP, soit environ 975 000 heures-GPU H100, l’équivalent d’environ 450 GPU H100 mobilisés pendant trois mois.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie5 mars 2025
Connaissances jusqu'à2024-11-28
Multimodalnon
Paramètres32 milliards
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MATH-50090,6 %24ᵉ / 31llm-statsAuto-déclaré
IFEval83,9 %43ᵉ / 65llm-statsAuto-déclaré
AIME 202479,5 %30ᵉ / 52llm-statsAuto-déclaré
LiveBench73,1 %22ᵉ / 38llm-statsAuto-déclaré
BFCL66,4 %10ᵉ / 11llm-statsAuto-déclaré
GPQA65,2 %130ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench63,4 %29ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Classements Arena (Elo)

CatégorieEloRang
Arena Text1336193ᵉ

Entraînement & empreinte

IndicateurValeur
Compute d'entraînement3,5 × 10²⁴ FLOP
Jeu de donnéesUnspecified unreleased
PaysChina

Notre analyse

Forces. À sa sortie, QwQ-32B se plaçait dans le top 24% des LLM de sa période sur GPQA, ce qui le situait dans le haut de sa génération sur ce benchmark. Sa licence Apache 2.0 autorise les usages commerciaux et son statut open-weights le distingue des modèles uniquement accessibles par API propriétaire. Sa fenêtre de contexte de 131 072 tokens reste un élément structurant de sa fiche, notamment face à des modèles plus petits ou plus contraints en contexte. Les données disponibles reposent sur 4 sources concordantes, ce qui donne une base cohérente pour situer le modèle.

Limites et points d'attention. QwQ-32B est aujourd’hui un modèle ancien dans un marché qui évolue très vite, avec des performances probablement largement dépassées par les modèles haut de gamme récents. Son classement Arena text le place loin des premières positions, et son ancienneté signifie qu’il est souvent retiré ou moins mis en avant dans les catalogues d’éditeur. Ses connaissances s’arrêtent au 2024-11-28, ce qui limite sa pertinence sur les événements et technologies apparus ensuite. L’élément qui reste le plus marquant est l’effort d’entraînement annoncé, 3,5 × 10²⁴ FLOP, environ 975 000 heures-GPU H100, soit près de 450 GPU H100 pendant trois mois.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.