Qwen3.5-4B
Qwen3.5-4B est un LLM de Qwen sorti le 2 mars 2026, avec 4 milliards de paramètres. Son positionnement est celui d’un modèle compact, publié en open-weights sous licence Apache 2.0, avec un usage commercial autorisé.
Qwen3.5-4B est un LLM de Qwen sorti le 2 mars 2026, avec 4 milliards de paramètres. Son positionnement est celui d’un modèle compact, publié en open-weights sous licence Apache 2.0, avec un usage commercial autorisé.
À sa sortie, Qwen3.5-4B se situait dans le top 39% des LLM de sa génération sur GPQA, parmi 166 modèles comparés sur une fenêtre de ±9 mois. La fiche documente donc un modèle récent, ouvert et plutôt bien placé pour sa période.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 2 mars 2026 |
| Multimodal | oui |
| Paramètres | 4 milliards |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| IFEval | 89,8 % | 16ᵉ / 65 | llm-stats | Auto-déclaré |
| MMLU-Redux | 88,8 % | 28ᵉ / 48 | llm-stats | Auto-déclaré |
| C-Eval | 85,1 % | 13ᵉ / 18 | llm-stats | Auto-déclaré |
| t2-bench | 79,9 % | 12ᵉ / 23 | llm-stats | Auto-déclaré |
| MMLU-Pro | 79,1 % | 54ᵉ / 125 | llm-stats | Auto-déclaré |
| Global PIQA | 78,9 % | 11ᵉ / 13 | llm-stats | Auto-déclaré |
| MAXIFE | 78,0 % | 9ᵉ / 11 | llm-stats | Auto-déclaré |
| HMMT25 | 76,8 % | 14ᵉ / 25 | llm-stats | Auto-déclaré |
| GPQA | 76,2 % | 86ᵉ / 213 | llm-stats | Auto-déclaré |
| MMMLU | 76,1 % | 42ᵉ / 49 | llm-stats | Auto-déclaré |
| HMMT 2025 | 74,0 % | 27ᵉ / 33 | llm-stats | Auto-déclaré |
| MMLU-ProX | 71,5 % | 20ᵉ / 32 | llm-stats | Auto-déclaré |
| Include | 71,0 % | 21ᵉ / 31 | llm-stats | Auto-déclaré |
| WMT24++ | 66,6 % | 13ᵉ / 23 | llm-stats | Auto-déclaré |
| IFBench | 59,2 % | 23ᵉ / 27 | llm-stats | Auto-déclaré |
| AA-LCR | 57,0 % | 12ᵉ / 14 | llm-stats | Auto-déclaré |
| LiveCodeBench v6 | 55,8 % | 40ᵉ / 53 | llm-stats | Auto-déclaré |
| NOVA-63 | 54,3 % | 9ᵉ / 11 | llm-stats | Auto-déclaré |
| SuperGPQA | 52,9 % | 26ᵉ / 34 | llm-stats | Auto-déclaré |
| PolyMATH | 51,1 % | 13ᵉ / 23 | llm-stats | Auto-déclaré |
| BFCL-V4 | 50,3 % | 11ᵉ / 13 | llm-stats | Auto-déclaré |
| LongBench v2 | 50,0 % | 12ᵉ / 15 | llm-stats | Auto-déclaré |
| Multi-Challenge | 49,0 % | 17ᵉ / 28 | llm-stats | Auto-déclaré |
| VITA-Bench | 22,0 % | 10ᵉ / 10 | llm-stats | Auto-déclaré |
| DeepPlanning | 17,6 % | 9ᵉ / 9 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Qwen3.5-4B combine un format 4B et une licence Apache 2.0, deux éléments importants pour un modèle open-weights destiné à être réutilisé dans des contextes commerciaux. Son résultat sur GPQA le place, à sa sortie, dans la partie supérieure des LLM de la même période, sans atteindre le tout premier rang. Cette position est notable pour un modèle de 4 milliards de paramètres, car elle indique un niveau compétitif dans sa génération sur le seul benchmark documenté.
Limites et points d'attention. Les informations vérifiées restent étroites : la couverture repose sur 1 source de données concordantes et aucun autre benchmark n’est fourni pour situer le modèle en code, en usage agentique, en mathématiques avancées ou en préférence utilisateur. L’absence de données sur le coût d’entraînement, le compute, les tarifs et les modalités de déploiement limite aussi l’analyse économique. Qwen3.5-4B convient surtout à une lecture de fiche centrée sur un petit LLM open-weights récent, commercialement réutilisable, avec un repère de performance public sur GPQA.
Sources des données : LLM-Stats (llm-stats.com).