Qwen

Qwen2.5 32B Instruct

Qwen2.5 32B Instruct est un LLM open-weights de Qwen, publié le 19 septembre 2024 sous licence Apache 2.0, avec usage commercial autorisé. Avec 32 milliards de paramètres, il se place dans la catégorie des modèles instruct intermédiaires, entre les petits modèles faciles à déployer et…

Son ancienneté, environ deux ans, est désormais très importante à l’échelle de l’IA. La fiche le situe donc surtout dans le contexte de sa génération, avec une fenêtre de contexte très large et des connaissances arrêtées au 30 juin 2024.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Qwen
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	19 septembre 2024
Connaissances jusqu'à	2024-06-30
Multimodal	non
Paramètres	32 milliards
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
GSM8k	95,9 %	7ᵉ / 47	llm-stats	Auto-déclaré
HumanEval	88,4 %	20ᵉ / 65	llm-stats	Auto-déclaré
HellaSwag	85,2 %	13ᵉ / 27	llm-stats	Auto-déclaré
BBH	84,5 %	4ᵉ / 12	llm-stats	Auto-déclaré
MBPP	84,0 %	7ᵉ / 33	llm-stats	Auto-déclaré
MMLU-Redux	83,9 %	35ᵉ / 48	llm-stats	Auto-déclaré
MMLU	83,3 %	46ᵉ / 98	llm-stats	Auto-déclaré
MATH	83,1 %	15ᵉ / 70	llm-stats	Auto-déclaré
Winogrande	82,0 %	8ᵉ / 22	llm-stats	Auto-déclaré
MultiPL-E	75,4 %	6ᵉ / 13	llm-stats	Auto-déclaré
ARC-C	70,4 %	22ᵉ / 34	llm-stats	Auto-déclaré
MMLU-Pro	69,0 %	82ᵉ / 125	llm-stats	Auto-déclaré
MBPP+	67,2 %	2ᵉ / 4	llm-stats	Auto-déclaré
TruthfulQA	57,8 %	11ᵉ / 18	llm-stats	Auto-déclaré
HumanEval+	52,4 %	8ᵉ / 10	llm-stats	Auto-déclaré
GPQA	49,5 %	158ᵉ / 213	llm-stats	Auto-déclaré
TheoremQA	44,1 %	2ᵉ / 6	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Qwen2.5 32B Instruct se situait dans le haut du panier de sa génération sur GPQA, avec un classement dans le top 34% des 35 LLM comparables de la même période. Sa fenêtre de contexte de 131 072 tokens constituait un atout concret pour traiter de longs documents, des historiques étendus ou des consignes volumineuses sans découpage excessif. Sa licence Apache 2.0 et son statut open-weights donnaient aussi une marge d’exploitation importante, notamment pour des usages commerciaux, des déploiements contrôlés ou des adaptations internes.

Limites et points d'attention. Le modèle doit être lu comme un modèle de 2024, pas comme une référence actuelle. Environ deux ans d’ancienneté représentent un écart très long dans l’IA générative, et ses performances sont aujourd’hui probablement largement dépassées par les modèles haut de gamme plus récents. Il peut aussi être souvent retiré du catalogue actif de l’éditeur, ce qui réduit son intérêt comme choix par défaut pour un nouveau projet. Ses connaissances s’arrêtent au 30 juin 2024, ce qui impose une vigilance sur les faits postérieurs à cette date. Les informations disponibles reposent sur 2 sources concordantes, un socle utile mais limité pour documenter finement son comportement réel.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

Qwen2.5 32B Instruct

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast