Qwen

QwQ-32B

QwQ-32B est un LLM open-weights de Qwen, publié le 5 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Son ancienneté d’environ un an est déjà très longue à l’échelle de l’IA, ce qui le situe surtout comme un modèle de sa génération plutôt que comme une référence actuelle.

Le modèle compte 32 milliards de paramètres et accepte 131 072 tokens de contexte, un format notable pour traiter de longs échanges ou documents. Son entraînement déclaré atteint 3,5 × 10²⁴ FLOP, soit environ 975 000 heures-GPU H100, l’équivalent d’environ 450 GPU H100 mobilisés pendant trois mois.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Qwen
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	5 mars 2025
Connaissances jusqu'à	2024-11-28
Multimodal	non
Paramètres	32 milliards
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MATH-500	90,6 %	24ᵉ / 31	llm-stats	Auto-déclaré
IFEval	83,9 %	43ᵉ / 65	llm-stats	Auto-déclaré
AIME 2024	79,5 %	30ᵉ / 52	llm-stats	Auto-déclaré
LiveBench	73,1 %	22ᵉ / 38	llm-stats	Auto-déclaré
BFCL	66,4 %	10ᵉ / 11	llm-stats	Auto-déclaré
GPQA	65,2 %	130ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	63,4 %	29ᵉ / 72	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1336	193ᵉ

Entraînement & empreinte

Indicateur	Valeur
Compute d'entraînement	3,5 × 10²⁴ FLOP
Jeu de données	Unspecified unreleased
Pays	China

Notre analyse

Forces. À sa sortie, QwQ-32B se plaçait dans le top 24% des LLM de sa période sur GPQA, ce qui le situait dans le haut de sa génération sur ce benchmark. Sa licence Apache 2.0 autorise les usages commerciaux et son statut open-weights le distingue des modèles uniquement accessibles par API propriétaire. Sa fenêtre de contexte de 131 072 tokens reste un élément structurant de sa fiche, notamment face à des modèles plus petits ou plus contraints en contexte. Les données disponibles reposent sur 4 sources concordantes, ce qui donne une base cohérente pour situer le modèle.

Limites et points d'attention. QwQ-32B est aujourd’hui un modèle ancien dans un marché qui évolue très vite, avec des performances probablement largement dépassées par les modèles haut de gamme récents. Son classement Arena text le place loin des premières positions, et son ancienneté signifie qu’il est souvent retiré ou moins mis en avant dans les catalogues d’éditeur. Ses connaissances s’arrêtent au 2024-11-28, ce qui limite sa pertinence sur les événements et technologies apparus ensuite. L’élément qui reste le plus marquant est l’effort d’entraînement annoncé, 3,5 × 10²⁴ FLOP, environ 975 000 heures-GPU H100, soit près de 450 GPU H100 pendant trois mois.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.

QwQ-32B

Caractéristiques

Performances (benchmarks)

Classements Arena (Elo)

Entraînement & empreinte

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast