Qwen

Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct est un LLM open-weights publié par Qwen le 10 septembre 2025, sous licence Apache 2.0 avec usage commercial autorisé. Le modèle combine 80 milliards de paramètres et 3 milliards de paramètres actifs, un profil qui le positionne comme une option d’inférence…

Sa fenêtre de contexte de 262 144 tokens constitue son trait le plus visible, avec une base de connaissances indiquée jusqu’au 30 septembre 2025. Son positionnement tarifaire est très économique, avec un tarif annoncé gratuit et 100% inférieur à la moyenne des LLM similaires.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Qwen
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	10 septembre 2025
Connaissances jusqu'à	2025-09-30
Multimodal	non
Paramètres	80 milliards
Paramètres actifs	3 milliards
Fenêtre de contexte	262 144 tokens
Modalités (entrée → sortie)	text → text

Indices de synthèse

Indice	Valeur	Rang (LLM)
Intelligence Index	13.7	117ᵉ / 136
Math Index	66.3	23ᵉ / 55

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
LiveBench: Mathematics	70,2 %	55ᵉ / 76	livebench	✅ Mesuré
LiveBench: Coding	68,2 %	53ᵉ / 76	livebench	✅ Mesuré
LiveBench: Language	66,3 %	51ᵉ / 76	livebench	✅ Mesuré
LiveBench: Reasoning	54,7 %	56ᵉ / 76	livebench	✅ Mesuré
LiveBench: Data Analysis	49,8 %	52ᵉ / 76	livebench	✅ Mesuré
LiveBench: Global average	48,3 %	63ᵉ / 76	livebench	✅ Mesuré
LiveBench: IF	19,2 %	71ᵉ / 76	livebench	✅ Mesuré
LiveBench: Agentic Coding	10,0 %	67ᵉ / 76	livebench	✅ Mesuré
MMLU-Redux	90,9 %	23ᵉ / 48	llm-stats	Auto-déclaré
MultiPL-E	87,8 %	2ᵉ / 13	llm-stats	Auto-déclaré
IFEval	87,6 %	31ᵉ / 65	llm-stats	Auto-déclaré
WritingBench	87,3 %	2ᵉ / 15	llm-stats	Auto-déclaré
Creative Writing v3	85,3 %	7ᵉ / 12	llm-stats	Auto-déclaré
Arena-Hard v2	82,7 %	2ᵉ / 16	llm-stats	Auto-déclaré
MMLU-Pro	80,6 %	49ᵉ / 125	llm-stats	Auto-déclaré
Include	78,9 %	13ᵉ / 31	llm-stats	Auto-déclaré
MMLU-ProX	76,7 %	16ᵉ / 32	llm-stats	Auto-déclaré
LiveBench 20241125	75,8 %	4ᵉ / 14	llm-stats	Auto-déclaré
Multi-IF	75,8 %	8ᵉ / 20	llm-stats	Auto-déclaré
GPQA	72,9 %	105ᵉ / 213	llm-stats	Auto-déclaré
BFCL-v3	70,3 %	10ᵉ / 19	llm-stats	Auto-déclaré
AIME 2025	69,5 %	84ᵉ / 108	llm-stats	Auto-déclaré
TAU-bench Retail	60,9 %	18ᵉ / 24	llm-stats	Auto-déclaré
SuperGPQA	58,8 %	19ᵉ / 34	llm-stats	Auto-déclaré
Tau2 Retail	57,3 %	24ᵉ / 25	llm-stats	Auto-déclaré
LiveCodeBench v6	56,6 %	39ᵉ / 53	llm-stats	Auto-déclaré
HMMT25	54,1 %	21ᵉ / 25	llm-stats	Auto-déclaré
Aider-Polyglot	49,8 %	16ᵉ / 22	llm-stats	Auto-déclaré
PolyMATH	45,9 %	16ᵉ / 23	llm-stats	Auto-déclaré
Tau2 Airline	45,5 %	20ᵉ / 22	llm-stats	Auto-déclaré
TAU-bench Airline	44,0 %	17ᵉ / 22	llm-stats	Auto-déclaré
Tau2 Telecom	13,2 %	34ᵉ / 34	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

Claude Fable 559.9

GPT-5.451.4

Gemini 3.1 Pro Preview46.5

Llama 4 Maverick14.3

▶ Qwen3-Next-80B-A3B-Inst…13.7

Math Index

GPT-5 Codex98.7

gemini-3-flash97.0

DeepSeek V3.292.0

Qwen3-235B-A22B-Instruc…71.7

▶ Qwen3-Next-80B-A3B-Inst…66.3

Llama 4 Maverick19.3

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1401	118ᵉ

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
Venice (Beta)	gratuit	gratuit	n.d.
DeepInfra	0,09 $	1,1 $	n.d.
artificialanalysis	0,5 $	2 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.

Notre analyse

Forces. Qwen3-Next-80B-A3B-Instruct ressort surtout sur les tâches mathématiques : son Math Index le place dans le haut du tableau de l’échantillon disponible, et LiveBench: Mathematics confirme ce point fort sur les mathématiques. LiveBench: Coding indique aussi un niveau exploitable en programmation, sans atteindre les meilleurs modèles du panel. À sa sortie, son classement GPQA le situait dans le top 34% des LLM de sa génération, ce qui en faisait un modèle compétitif sur ce test exigeant à son époque. La licence Apache 2.0, les poids ouverts et le coût annoncé nul renforcent son intérêt pour l’expérimentation, l’auto-hébergement et les déploiements sensibles au budget.

Limites et points d'attention. Son Intelligence Index reste bas dans le classement disponible, et la moyenne globale LiveBench le place plutôt dans la seconde moitié du panel. Les scores en raisonnement, analyse de données et compréhension du langage apparaissent moins solides que son profil mathématique. Arena text le classe également loin des modèles les mieux notés en préférence utilisateur. Le modèle convient surtout à des usages où le coût, la licence ouverte, la longue fenêtre de contexte et les tâches mathématiques priment sur la performance générale de haut niveau.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai).

Qwen3-Next-80B-A3B-Instruct

Caractéristiques

Indices de synthèse

Performances (benchmarks)

Comment se situe-t-il ?

Classements Arena (Elo)

Tarifs

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast