Qwen3.5-4B

Qwen3.5-4B est un LLM de Qwen sorti le 2 mars 2026, avec 4 milliards de paramètres. Son positionnement est celui d’un modèle compact, publié en open-weights sous licence Apache 2.0, avec un usage commercial autorisé.

Qwen3.5-4B est un LLM de Qwen sorti le 2 mars 2026, avec 4 milliards de paramètres. Son positionnement est celui d’un modèle compact, publié en open-weights sous licence Apache 2.0, avec un usage commercial autorisé.

À sa sortie, Qwen3.5-4B se situait dans le top 39% des LLM de sa génération sur GPQA, parmi 166 modèles comparés sur une fenêtre de ±9 mois. La fiche documente donc un modèle récent, ouvert et plutôt bien placé pour sa période.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie2 mars 2026
Multimodaloui
Paramètres4 milliards

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
IFEval89,8 %16ᵉ / 65llm-statsAuto-déclaré
MMLU-Redux88,8 %28ᵉ / 48llm-statsAuto-déclaré
C-Eval85,1 %13ᵉ / 18llm-statsAuto-déclaré
t2-bench79,9 %12ᵉ / 23llm-statsAuto-déclaré
MMLU-Pro79,1 %54ᵉ / 125llm-statsAuto-déclaré
Global PIQA78,9 %11ᵉ / 13llm-statsAuto-déclaré
MAXIFE78,0 %9ᵉ / 11llm-statsAuto-déclaré
HMMT2576,8 %14ᵉ / 25llm-statsAuto-déclaré
GPQA76,2 %86ᵉ / 213llm-statsAuto-déclaré
MMMLU76,1 %42ᵉ / 49llm-statsAuto-déclaré
HMMT 202574,0 %27ᵉ / 33llm-statsAuto-déclaré
MMLU-ProX71,5 %20ᵉ / 32llm-statsAuto-déclaré
Include71,0 %21ᵉ / 31llm-statsAuto-déclaré
WMT24++66,6 %13ᵉ / 23llm-statsAuto-déclaré
IFBench59,2 %23ᵉ / 27llm-statsAuto-déclaré
AA-LCR57,0 %12ᵉ / 14llm-statsAuto-déclaré
LiveCodeBench v655,8 %40ᵉ / 53llm-statsAuto-déclaré
NOVA-6354,3 %9ᵉ / 11llm-statsAuto-déclaré
SuperGPQA52,9 %26ᵉ / 34llm-statsAuto-déclaré
PolyMATH51,1 %13ᵉ / 23llm-statsAuto-déclaré
BFCL-V450,3 %11ᵉ / 13llm-statsAuto-déclaré
LongBench v250,0 %12ᵉ / 15llm-statsAuto-déclaré
Multi-Challenge49,0 %17ᵉ / 28llm-statsAuto-déclaré
VITA-Bench22,0 %10ᵉ / 10llm-statsAuto-déclaré
DeepPlanning17,6 %9ᵉ / 9llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Qwen3.5-4B combine un format 4B et une licence Apache 2.0, deux éléments importants pour un modèle open-weights destiné à être réutilisé dans des contextes commerciaux. Son résultat sur GPQA le place, à sa sortie, dans la partie supérieure des LLM de la même période, sans atteindre le tout premier rang. Cette position est notable pour un modèle de 4 milliards de paramètres, car elle indique un niveau compétitif dans sa génération sur le seul benchmark documenté.

Limites et points d'attention. Les informations vérifiées restent étroites : la couverture repose sur 1 source de données concordantes et aucun autre benchmark n’est fourni pour situer le modèle en code, en usage agentique, en mathématiques avancées ou en préférence utilisateur. L’absence de données sur le coût d’entraînement, le compute, les tarifs et les modalités de déploiement limite aussi l’analyse économique. Qwen3.5-4B convient surtout à une lecture de fiche centrée sur un petit LLM open-weights récent, commercialement réutilisable, avec un repère de performance public sur GPQA.


Sources des données : LLM-Stats (llm-stats.com).