Qwen1.5-32B
Qwen1.5-32B est un LLM publié par Qwen le 3 avril 2024. Avec environ deux ans d’ancienneté, il appartient déjà à une génération très ancienne à l’échelle de l’IA, à situer surtout face aux modèles disponibles autour de sa sortie plutôt qu’aux systèmes actuels.
Qwen1.5-32B est un LLM publié par Qwen le 3 avril 2024. Avec environ deux ans d’ancienneté, il appartient déjà à une génération très ancienne à l’échelle de l’IA, à situer surtout face aux modèles disponibles autour de sa sortie plutôt qu’aux systèmes actuels.
Ce modèle se caractérise par une documentation publique limitée dans les données retenues ici, avec une seule source concordante. Son intérêt principal est donc historique et comparatif : mesurer la place d’un LLM Qwen de taille 32B dans le paysage des modèles du printemps 2024.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Date de sortie | 3 avril 2024 |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: GPQA diamond | 30,7 % | 118ᵉ / 132 | epoch | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Epoch: GPQA diamond
Notre analyse
Forces. À sa sortie, Qwen1.5-32B restait dans le top 69% des LLM de sa génération sur Epoch: GPQA diamond, un benchmark centré sur des questions scientifiques de niveau doctorat. Cette position indique un modèle encore comparable à une partie des LLM publiés dans la même fenêtre de temps, même s’il ne faisait pas partie du tout premier rang. Dans une modelothèque, son principal intérêt est de servir de repère pour suivre l’évolution des modèles Qwen et le niveau atteint par les LLM intermédiaires au début de 2024.
Limites et points d'attention. Le score observé sur GPQA diamond le place aujourd’hui très bas dans le classement disponible, signe de performances largement dépassées sur les tâches scientifiques difficiles. Son ancienneté pèse fortement : deux ans représentent un cycle très long pour les LLM, et ce type de modèle est souvent retiré ou remplacé dans les catalogues des éditeurs. Les données fournies ne contiennent aucun chiffre sur le compute, l’équivalent GPU H100 ou le coût d’entraînement, ce qui empêche de quantifier l’effort matériel derrière le modèle.
Sources des données : Epoch AI (epoch.ai), CC-BY-4.0.