Qwen: Qwen3.6 Max Preview
Qwen: Qwen3.6 Max Preview est un LLM de Qwen sorti le 27 avril 2026, positionné comme un modèle récent à très grande fenêtre de contexte. Sa capacité de 262 144 tokens le place dans la catégorie des modèles adaptés aux entrées longues, avec un intérêt particulier pour les documents…
Qwen: Qwen3.6 Max Preview est un LLM de Qwen sorti le 27 avril 2026, positionné comme un modèle récent à très grande fenêtre de contexte. Sa capacité de 262 144 tokens le place dans la catégorie des modèles adaptés aux entrées longues, avec un intérêt particulier pour les documents volumineux, les historiques étendus et les traitements nécessitant beaucoup de contexte.
Son positionnement se distingue aussi par le prix: Qwen le propose dans une tranche très économique, nettement sous la moyenne des LLM similaires et bien moins cher que les modèles frontière. Les données disponibles reposent sur 4 sources concordantes.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Date de sortie | 27 avril 2026 |
| Multimodal | non |
| Fenêtre de contexte | 262 144 tokens |
| Modalités (entrée → sortie) | text → text |
Indices de synthèse
| Indice | Valeur | Rang (LLM) |
|---|---|---|
| Intelligence Index | 40.0 | 21ᵉ / 136 |
Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : Hallucinations (Baseline) | 100,0 % | 1ᵉ / 229 | benchable | ✅ Mesuré |
| Benchable : Email Classification (Baseline) | 99,0 % | 24ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 84,8 % | 30ᵉ / 252 | benchable | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Intelligence Index
Benchable : Hallucinations (Baseline)
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Code | 1483 | 19ᵉ |
| Arena Text | 1460 | 34ᵉ |
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Alibaba Cloud Int. | 1,04 $ | 6,24 $ | n.d. |
| artificialanalysis | 1,3 $ | 7,8 $ | 0,13 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 47 % en dessous de la moyenne des LLM similaires, et 4,6 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0,67 $ |
| Latence moyenne par benchmark — Benchable | 37 min 49 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. Qwen: Qwen3.6 Max Preview se démarque d’abord par son excellent résultat sur Hallucinations (Baseline), où il figure tout en haut du classement, un signal favorable pour les tâches où la stabilité factuelle compte. Ses résultats en Email Classification (Baseline) indiquent aussi une bonne aptitude aux tâches de tri et de catégorisation de messages. Instruction Following (Baseline) le place dans une zone solide pour l’exécution de consignes, même si ce n’est pas son point le plus dominant. Les classements Arena montrent un profil plus convaincant en code qu’en texte général, avec une position plus haute sur Arena code. Son autre atout majeur reste économique: le tarif est 47% inférieur à la moyenne des LLM similaires et environ 4,6 fois moins cher que les modèles frontière.
Limites et points d'attention. Malgré un Intelligence Index situé dans le haut du tableau, Qwen: Qwen3.6 Max Preview n’occupe pas les toutes premières places globales. Son classement Arena text est plus modéré que son classement en code, ce qui suggère un avantage moins net sur les usages rédactionnels ou conversationnels généralistes. Le niveau en Instruction Following reste bon, mais pas au sommet du benchmark, ce qui peut compter pour les scénarios à consignes complexes ou très strictes. Le statut “Preview” indique aussi une version à considérer comme moins définitive qu’un modèle pleinement stabilisé. Le modèle paraît surtout pertinent pour des usages à fort volume de contexte, de classification, de code et de contrôle des coûts.
Sources des données : OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Arena.ai (arena.ai) · Benchable.ai (benchable.ai).