Qwen3 32B

Qwen3 32B est un LLM open-weights de Qwen, publié le 29 avril 2025 sous licence Apache 2.0 avec usage commercial autorisé. Avec environ un an d’ancienneté, il appartient déjà à une génération très datée à l’échelle de l’IA, ce qui le situe d’abord face aux modèles de sa période plutôt…

Qwen3 32B est un LLM open-weights de Qwen, publié le 29 avril 2025 sous licence Apache 2.0 avec usage commercial autorisé. Avec environ un an d’ancienneté, il appartient déjà à une génération très datée à l’échelle de l’IA, ce qui le situe d’abord face aux modèles de sa période plutôt qu’aux meilleurs systèmes actuels.

Son positionnement combine un gabarit de 33 milliards de paramètres, une fenêtre de contexte longue et un tarif très économique. Son coût est annoncé 96% sous la moyenne des LLM similaires et environ 60.4 fois inférieur à celui des modèles frontière, ce qui en fait surtout un modèle à faible coût d’exploitation.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie29 avril 2025
Connaissances jusqu'à2025-03-31
Multimodalnon
Paramètres33 milliards
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
LiveBench: Mathematics67,4 %60ᵉ / 76livebench✅ Mesuré
LiveBench: Coding66,0 %61ᵉ / 76livebench✅ Mesuré
LiveBench: Language55,5 %63ᵉ / 76livebench✅ Mesuré
LiveBench: Reasoning48,3 %59ᵉ / 76livebench✅ Mesuré
LiveBench: Data Analysis46,5 %60ᵉ / 76livebench✅ Mesuré
LiveBench: Global average43,6 %68ᵉ / 76livebench✅ Mesuré
LiveBench: IF17,8 %72ᵉ / 76livebench✅ Mesuré
LiveBench: Agentic Coding3,3 %71ᵉ / 76livebench✅ Mesuré
Arena Hard93,8 %2ᵉ / 26llm-statsAuto-déclaré
AIME 202481,4 %22ᵉ / 52llm-statsAuto-déclaré
LiveBench74,9 %15ᵉ / 38llm-statsAuto-déclaré
AIME 202572,9 %76ᵉ / 108llm-statsAuto-déclaré
BFCL70,3 %6ᵉ / 11llm-statsAuto-déclaré
CodeForces65,9 %13ᵉ / 16llm-statsAuto-déclaré
LiveCodeBench65,7 %26ᵉ / 72llm-statsAuto-déclaré
Aider50,2 %4ᵉ / 4llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

LiveBench: Mathematics

Qwen3.7 Max85 %
▶ Qwen3 32B67 %

LiveBench: Coding

▶ Qwen3 32B66 %

Classements Arena (Elo)

CatégorieEloRang
Arena Text1347179ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
DeepInfra0,08 $0,28 $n.d.
deepinfra0,1 $0,3 $n.d.
novita0,1 $0,44 $n.d.
sambanova0,4 $0,8 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 96 % en dessous de la moyenne des LLM similaires, et 60,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. Qwen3 32B se distingue d’abord par son accessibilité économique et juridique : ses poids ouverts, sa licence Apache 2.0 et son tarif très bas facilitent les déploiements commerciaux maîtrisés. À sa sortie, il figurait dans le top 80% des LLM de sa génération sur LiveBench: Global average, ce qui le place dans le paysage des modèles compétitifs de sa période, sans en faire un modèle de tête. Ses meilleurs signaux viennent de LiveBench: Mathematics (mathématiques) et LiveBench: Coding (programmation), où ses scores sont nettement supérieurs à ses résultats en raisonnement général ou en analyse de données. Sa fenêtre de contexte de 131 072 tokens constitue aussi un atout concret pour traiter de longs documents ou de grands historiques de conversation.

Limites et points d'attention. Qwen3 32B est aujourd’hui un modèle ancien : ses performances sont probablement largement dépassées par les générations plus récentes et il est souvent retiré du catalogue de l’éditeur. Ses classements LiveBench restent bas dans l’échantillon disponible, notamment en Language (compréhension du langage), Reasoning (raisonnement), Data Analysis (analyse de données) et moyenne globale. Son rang Arena text reste également éloigné des premiers modèles conversationnels. Les connaissances s’arrêtent au 31 mars 2025, ce qui impose une vigilance sur les sujets récents.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai).