Qwen2.5 32B Instruct

Qwen2.5 32B Instruct est un LLM open-weights de Qwen, publié le 19 septembre 2024 sous licence Apache 2.0, avec usage commercial autorisé. Avec 32 milliards de paramètres, il se place dans la catégorie des modèles instruct intermédiaires, entre les petits modèles faciles à déployer et…

Qwen2.5 32B Instruct est un LLM open-weights de Qwen, publié le 19 septembre 2024 sous licence Apache 2.0, avec usage commercial autorisé. Avec 32 milliards de paramètres, il se place dans la catégorie des modèles instruct intermédiaires, entre les petits modèles faciles à déployer et les très grands modèles haut de gamme.

Son ancienneté, environ deux ans, est désormais très importante à l’échelle de l’IA. La fiche le situe donc surtout dans le contexte de sa génération, avec une fenêtre de contexte très large et des connaissances arrêtées au 30 juin 2024.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie19 septembre 2024
Connaissances jusqu'à2024-06-30
Multimodalnon
Paramètres32 milliards
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
GSM8k95,9 %7ᵉ / 47llm-statsAuto-déclaré
HumanEval88,4 %20ᵉ / 65llm-statsAuto-déclaré
HellaSwag85,2 %13ᵉ / 27llm-statsAuto-déclaré
BBH84,5 %4ᵉ / 12llm-statsAuto-déclaré
MBPP84,0 %7ᵉ / 33llm-statsAuto-déclaré
MMLU-Redux83,9 %35ᵉ / 48llm-statsAuto-déclaré
MMLU83,3 %46ᵉ / 98llm-statsAuto-déclaré
MATH83,1 %15ᵉ / 70llm-statsAuto-déclaré
Winogrande82,0 %8ᵉ / 22llm-statsAuto-déclaré
MultiPL-E75,4 %6ᵉ / 13llm-statsAuto-déclaré
ARC-C70,4 %22ᵉ / 34llm-statsAuto-déclaré
MMLU-Pro69,0 %82ᵉ / 125llm-statsAuto-déclaré
MBPP+67,2 %2ᵉ / 4llm-statsAuto-déclaré
TruthfulQA57,8 %11ᵉ / 18llm-statsAuto-déclaré
HumanEval+52,4 %8ᵉ / 10llm-statsAuto-déclaré
GPQA49,5 %158ᵉ / 213llm-statsAuto-déclaré
TheoremQA44,1 %2ᵉ / 6llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Qwen2.5 32B Instruct se situait dans le haut du panier de sa génération sur GPQA, avec un classement dans le top 34% des 35 LLM comparables de la même période. Sa fenêtre de contexte de 131 072 tokens constituait un atout concret pour traiter de longs documents, des historiques étendus ou des consignes volumineuses sans découpage excessif. Sa licence Apache 2.0 et son statut open-weights donnaient aussi une marge d’exploitation importante, notamment pour des usages commerciaux, des déploiements contrôlés ou des adaptations internes.

Limites et points d'attention. Le modèle doit être lu comme un modèle de 2024, pas comme une référence actuelle. Environ deux ans d’ancienneté représentent un écart très long dans l’IA générative, et ses performances sont aujourd’hui probablement largement dépassées par les modèles haut de gamme plus récents. Il peut aussi être souvent retiré du catalogue actif de l’éditeur, ce qui réduit son intérêt comme choix par défaut pour un nouveau projet. Ses connaissances s’arrêtent au 30 juin 2024, ce qui impose une vigilance sur les faits postérieurs à cette date. Les informations disponibles reposent sur 2 sources concordantes, un socle utile mais limité pour documenter finement son comportement réel.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).