QwQ-32B
QwQ-32B est un LLM open-weights de Qwen, publié le 5 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Son ancienneté d’environ un an est déjà très longue à l’échelle de l’IA, ce qui le situe surtout comme un modèle de sa génération plutôt que comme une référence actuelle.
QwQ-32B est un LLM open-weights de Qwen, publié le 5 mars 2025 sous licence Apache 2.0, avec usage commercial autorisé. Son ancienneté d’environ un an est déjà très longue à l’échelle de l’IA, ce qui le situe surtout comme un modèle de sa génération plutôt que comme une référence actuelle.
Le modèle compte 32 milliards de paramètres et accepte 131 072 tokens de contexte, un format notable pour traiter de longs échanges ou documents. Son entraînement déclaré atteint 3,5 × 10²⁴ FLOP, soit environ 975 000 heures-GPU H100, l’équivalent d’environ 450 GPU H100 mobilisés pendant trois mois.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 5 mars 2025 |
| Connaissances jusqu'à | 2024-11-28 |
| Multimodal | non |
| Paramètres | 32 milliards |
| Fenêtre de contexte | 131 072 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MATH-500 | 90,6 % | 24ᵉ / 31 | llm-stats | Auto-déclaré |
| IFEval | 83,9 % | 43ᵉ / 65 | llm-stats | Auto-déclaré |
| AIME 2024 | 79,5 % | 30ᵉ / 52 | llm-stats | Auto-déclaré |
| LiveBench | 73,1 % | 22ᵉ / 38 | llm-stats | Auto-déclaré |
| BFCL | 66,4 % | 10ᵉ / 11 | llm-stats | Auto-déclaré |
| GPQA | 65,2 % | 130ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench | 63,4 % | 29ᵉ / 72 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1336 | 193ᵉ |
Entraînement & empreinte
| Indicateur | Valeur |
|---|---|
| Compute d'entraînement | 3,5 × 10²⁴ FLOP |
| Jeu de données | Unspecified unreleased |
| Pays | China |
Notre analyse
Forces. À sa sortie, QwQ-32B se plaçait dans le top 24% des LLM de sa période sur GPQA, ce qui le situait dans le haut de sa génération sur ce benchmark. Sa licence Apache 2.0 autorise les usages commerciaux et son statut open-weights le distingue des modèles uniquement accessibles par API propriétaire. Sa fenêtre de contexte de 131 072 tokens reste un élément structurant de sa fiche, notamment face à des modèles plus petits ou plus contraints en contexte. Les données disponibles reposent sur 4 sources concordantes, ce qui donne une base cohérente pour situer le modèle.
Limites et points d'attention. QwQ-32B est aujourd’hui un modèle ancien dans un marché qui évolue très vite, avec des performances probablement largement dépassées par les modèles haut de gamme récents. Son classement Arena text le place loin des premières positions, et son ancienneté signifie qu’il est souvent retiré ou moins mis en avant dans les catalogues d’éditeur. Ses connaissances s’arrêtent au 2024-11-28, ce qui limite sa pertinence sur les événements et technologies apparus ensuite. L’élément qui reste le plus marquant est l’effort d’entraînement annoncé, 3,5 × 10²⁴ FLOP, environ 975 000 heures-GPU H100, soit près de 450 GPU H100 pendant trois mois.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.