Qwen: Qwen3.6 Max Preview

Qwen: Qwen3.6 Max Preview est un LLM de Qwen sorti le 27 avril 2026, positionné comme un modèle récent à très grande fenêtre de contexte. Sa capacité de 262 144 tokens le place dans la catégorie des modèles adaptés aux entrées longues, avec un intérêt particulier pour les documents…

Qwen: Qwen3.6 Max Preview est un LLM de Qwen sorti le 27 avril 2026, positionné comme un modèle récent à très grande fenêtre de contexte. Sa capacité de 262 144 tokens le place dans la catégorie des modèles adaptés aux entrées longues, avec un intérêt particulier pour les documents volumineux, les historiques étendus et les traitements nécessitant beaucoup de contexte.

Son positionnement se distingue aussi par le prix: Qwen le propose dans une tranche très économique, nettement sous la moyenne des LLM similaires et bien moins cher que les modèles frontière. Les données disponibles reposent sur 4 sources concordantes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
Date de sortie27 avril 2026
Multimodalnon
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text → text

Indices de synthèse

IndiceValeurRang (LLM)
Intelligence Index40.021ᵉ / 136

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Hallucinations (Baseline)100,0 %1ᵉ / 229benchable✅ Mesuré
Benchable : Email Classification (Baseline)99,0 %24ᵉ / 254benchable✅ Mesuré
Benchable : Instruction Following (Baseline)84,8 %30ᵉ / 252benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

▶ Qwen3.6 Max Previ…40.0
Grok Build 0.1 061639.8

Benchable : Hallucinations (Baseline)

▶ Qwen3.6 Max Previ…100 %

Classements Arena (Elo)

CatégorieEloRang
Arena Code148319ᵉ
Arena Text146034ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Alibaba Cloud Int.1,04 $6,24 $n.d.
artificialanalysis1,3 $7,8 $0,13 $

Prix en dollars US par million de tokens.

Sa tarification se situe 47 % en dessous de la moyenne des LLM similaires, et 4,6 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,67 $
Latence moyenne par benchmark — Benchable37 min 49 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Qwen: Qwen3.6 Max Preview se démarque d’abord par son excellent résultat sur Hallucinations (Baseline), où il figure tout en haut du classement, un signal favorable pour les tâches où la stabilité factuelle compte. Ses résultats en Email Classification (Baseline) indiquent aussi une bonne aptitude aux tâches de tri et de catégorisation de messages. Instruction Following (Baseline) le place dans une zone solide pour l’exécution de consignes, même si ce n’est pas son point le plus dominant. Les classements Arena montrent un profil plus convaincant en code qu’en texte général, avec une position plus haute sur Arena code. Son autre atout majeur reste économique: le tarif est 47% inférieur à la moyenne des LLM similaires et environ 4,6 fois moins cher que les modèles frontière.

Limites et points d'attention. Malgré un Intelligence Index situé dans le haut du tableau, Qwen: Qwen3.6 Max Preview n’occupe pas les toutes premières places globales. Son classement Arena text est plus modéré que son classement en code, ce qui suggère un avantage moins net sur les usages rédactionnels ou conversationnels généralistes. Le niveau en Instruction Following reste bon, mais pas au sommet du benchmark, ce qui peut compter pour les scénarios à consignes complexes ou très strictes. Le statut “Preview” indique aussi une version à considérer comme moins définitive qu’un modèle pleinement stabilisé. Le modèle paraît surtout pertinent pour des usages à fort volume de contexte, de classification, de code et de contrôle des coûts.


Sources des données : OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Arena.ai (arena.ai) · Benchable.ai (benchable.ai).