Qwen3-Next-80B-A3B-Instruct

Qwen3-Next-80B-A3B-Instruct est un LLM open-weights publié par Qwen le 10 septembre 2025, sous licence Apache 2.0 avec usage commercial autorisé. Le modèle combine 80 milliards de paramètres et 3 milliards de paramètres actifs, un profil qui le positionne comme une option d’inférence…

Qwen3-Next-80B-A3B-Instruct est un LLM open-weights publié par Qwen le 10 septembre 2025, sous licence Apache 2.0 avec usage commercial autorisé. Le modèle combine 80 milliards de paramètres et 3 milliards de paramètres actifs, un profil qui le positionne comme une option d’inférence légère au regard de sa taille totale.

Sa fenêtre de contexte de 262 144 tokens constitue son trait le plus visible, avec une base de connaissances indiquée jusqu’au 30 septembre 2025. Son positionnement tarifaire est très économique, avec un tarif annoncé gratuit et 100% inférieur à la moyenne des LLM similaires.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie10 septembre 2025
Connaissances jusqu'à2025-09-30
Multimodalnon
Paramètres80 milliards
Paramètres actifs3 milliards
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text → text

Indices de synthèse

IndiceValeurRang (LLM)
Intelligence Index13.7117ᵉ / 136
Math Index66.323ᵉ / 55

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
LiveBench: Mathematics70,2 %55ᵉ / 76livebench✅ Mesuré
LiveBench: Coding68,2 %53ᵉ / 76livebench✅ Mesuré
LiveBench: Language66,3 %51ᵉ / 76livebench✅ Mesuré
LiveBench: Reasoning54,7 %56ᵉ / 76livebench✅ Mesuré
LiveBench: Data Analysis49,8 %52ᵉ / 76livebench✅ Mesuré
LiveBench: Global average48,3 %63ᵉ / 76livebench✅ Mesuré
LiveBench: IF19,2 %71ᵉ / 76livebench✅ Mesuré
LiveBench: Agentic Coding10,0 %67ᵉ / 76livebench✅ Mesuré
MMLU-Redux90,9 %23ᵉ / 48llm-statsAuto-déclaré
MultiPL-E87,8 %2ᵉ / 13llm-statsAuto-déclaré
IFEval87,6 %31ᵉ / 65llm-statsAuto-déclaré
WritingBench87,3 %2ᵉ / 15llm-statsAuto-déclaré
Creative Writing v385,3 %7ᵉ / 12llm-statsAuto-déclaré
Arena-Hard v282,7 %2ᵉ / 16llm-statsAuto-déclaré
MMLU-Pro80,6 %49ᵉ / 125llm-statsAuto-déclaré
Include78,9 %13ᵉ / 31llm-statsAuto-déclaré
MMLU-ProX76,7 %16ᵉ / 32llm-statsAuto-déclaré
LiveBench 2024112575,8 %4ᵉ / 14llm-statsAuto-déclaré
Multi-IF75,8 %8ᵉ / 20llm-statsAuto-déclaré
GPQA72,9 %105ᵉ / 213llm-statsAuto-déclaré
BFCL-v370,3 %10ᵉ / 19llm-statsAuto-déclaré
AIME 202569,5 %84ᵉ / 108llm-statsAuto-déclaré
TAU-bench Retail60,9 %18ᵉ / 24llm-statsAuto-déclaré
SuperGPQA58,8 %19ᵉ / 34llm-statsAuto-déclaré
Tau2 Retail57,3 %24ᵉ / 25llm-statsAuto-déclaré
LiveCodeBench v656,6 %39ᵉ / 53llm-statsAuto-déclaré
HMMT2554,1 %21ᵉ / 25llm-statsAuto-déclaré
Aider-Polyglot49,8 %16ᵉ / 22llm-statsAuto-déclaré
PolyMATH45,9 %16ᵉ / 23llm-statsAuto-déclaré
Tau2 Airline45,5 %20ᵉ / 22llm-statsAuto-déclaré
TAU-bench Airline44,0 %17ᵉ / 22llm-statsAuto-déclaré
Tau2 Telecom13,2 %34ᵉ / 34llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

▶ Qwen3-Next-80B-A3B-Inst…13.7

Math Index

gemini-3-flash97.0
DeepSeek V3.292.0
▶ Qwen3-Next-80B-A3B-Inst…66.3

Classements Arena (Elo)

CatégorieEloRang
Arena Text1401118ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Venice (Beta)gratuitgratuitn.d.
DeepInfra0,09 $1,1 $n.d.
artificialanalysis0,5 $2 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.

Notre analyse

Forces. Qwen3-Next-80B-A3B-Instruct ressort surtout sur les tâches mathématiques : son Math Index le place dans le haut du tableau de l’échantillon disponible, et LiveBench: Mathematics confirme ce point fort sur les mathématiques. LiveBench: Coding indique aussi un niveau exploitable en programmation, sans atteindre les meilleurs modèles du panel. À sa sortie, son classement GPQA le situait dans le top 34% des LLM de sa génération, ce qui en faisait un modèle compétitif sur ce test exigeant à son époque. La licence Apache 2.0, les poids ouverts et le coût annoncé nul renforcent son intérêt pour l’expérimentation, l’auto-hébergement et les déploiements sensibles au budget.

Limites et points d'attention. Son Intelligence Index reste bas dans le classement disponible, et la moyenne globale LiveBench le place plutôt dans la seconde moitié du panel. Les scores en raisonnement, analyse de données et compréhension du langage apparaissent moins solides que son profil mathématique. Arena text le classe également loin des modèles les mieux notés en préférence utilisateur. Le modèle convient surtout à des usages où le coût, la licence ouverte, la longue fenêtre de contexte et les tâches mathématiques priment sur la performance générale de haut niveau.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai).