Qwen3-Next-80B-A3B-Instruct
Qwen3-Next-80B-A3B-Instruct est un LLM open-weights publié par Qwen le 10 septembre 2025, sous licence Apache 2.0 avec usage commercial autorisé. Le modèle combine 80 milliards de paramètres et 3 milliards de paramètres actifs, un profil qui le positionne comme une option d’inférence…
Qwen3-Next-80B-A3B-Instruct est un LLM open-weights publié par Qwen le 10 septembre 2025, sous licence Apache 2.0 avec usage commercial autorisé. Le modèle combine 80 milliards de paramètres et 3 milliards de paramètres actifs, un profil qui le positionne comme une option d’inférence légère au regard de sa taille totale.
Sa fenêtre de contexte de 262 144 tokens constitue son trait le plus visible, avec une base de connaissances indiquée jusqu’au 30 septembre 2025. Son positionnement tarifaire est très économique, avec un tarif annoncé gratuit et 100% inférieur à la moyenne des LLM similaires.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 10 septembre 2025 |
| Connaissances jusqu'à | 2025-09-30 |
| Multimodal | non |
| Paramètres | 80 milliards |
| Paramètres actifs | 3 milliards |
| Fenêtre de contexte | 262 144 tokens |
| Modalités (entrée → sortie) | text → text |
Indices de synthèse
| Indice | Valeur | Rang (LLM) |
|---|---|---|
| Intelligence Index | 13.7 | 117ᵉ / 136 |
| Math Index | 66.3 | 23ᵉ / 55 |
Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| LiveBench: Mathematics | 70,2 % | 55ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Coding | 68,2 % | 53ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Language | 66,3 % | 51ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Reasoning | 54,7 % | 56ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Data Analysis | 49,8 % | 52ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Global average | 48,3 % | 63ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: IF | 19,2 % | 71ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Agentic Coding | 10,0 % | 67ᵉ / 76 | livebench | ✅ Mesuré |
| MMLU-Redux | 90,9 % | 23ᵉ / 48 | llm-stats | Auto-déclaré |
| MultiPL-E | 87,8 % | 2ᵉ / 13 | llm-stats | Auto-déclaré |
| IFEval | 87,6 % | 31ᵉ / 65 | llm-stats | Auto-déclaré |
| WritingBench | 87,3 % | 2ᵉ / 15 | llm-stats | Auto-déclaré |
| Creative Writing v3 | 85,3 % | 7ᵉ / 12 | llm-stats | Auto-déclaré |
| Arena-Hard v2 | 82,7 % | 2ᵉ / 16 | llm-stats | Auto-déclaré |
| MMLU-Pro | 80,6 % | 49ᵉ / 125 | llm-stats | Auto-déclaré |
| Include | 78,9 % | 13ᵉ / 31 | llm-stats | Auto-déclaré |
| MMLU-ProX | 76,7 % | 16ᵉ / 32 | llm-stats | Auto-déclaré |
| LiveBench 20241125 | 75,8 % | 4ᵉ / 14 | llm-stats | Auto-déclaré |
| Multi-IF | 75,8 % | 8ᵉ / 20 | llm-stats | Auto-déclaré |
| GPQA | 72,9 % | 105ᵉ / 213 | llm-stats | Auto-déclaré |
| BFCL-v3 | 70,3 % | 10ᵉ / 19 | llm-stats | Auto-déclaré |
| AIME 2025 | 69,5 % | 84ᵉ / 108 | llm-stats | Auto-déclaré |
| TAU-bench Retail | 60,9 % | 18ᵉ / 24 | llm-stats | Auto-déclaré |
| SuperGPQA | 58,8 % | 19ᵉ / 34 | llm-stats | Auto-déclaré |
| Tau2 Retail | 57,3 % | 24ᵉ / 25 | llm-stats | Auto-déclaré |
| LiveCodeBench v6 | 56,6 % | 39ᵉ / 53 | llm-stats | Auto-déclaré |
| HMMT25 | 54,1 % | 21ᵉ / 25 | llm-stats | Auto-déclaré |
| Aider-Polyglot | 49,8 % | 16ᵉ / 22 | llm-stats | Auto-déclaré |
| PolyMATH | 45,9 % | 16ᵉ / 23 | llm-stats | Auto-déclaré |
| Tau2 Airline | 45,5 % | 20ᵉ / 22 | llm-stats | Auto-déclaré |
| TAU-bench Airline | 44,0 % | 17ᵉ / 22 | llm-stats | Auto-déclaré |
| Tau2 Telecom | 13,2 % | 34ᵉ / 34 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Intelligence Index
Math Index
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1401 | 118ᵉ |
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Venice (Beta) | gratuit | gratuit | n.d. |
| DeepInfra | 0,09 $ | 1,1 $ | n.d. |
| artificialanalysis | 0,5 $ | 2 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.
Notre analyse
Forces. Qwen3-Next-80B-A3B-Instruct ressort surtout sur les tâches mathématiques : son Math Index le place dans le haut du tableau de l’échantillon disponible, et LiveBench: Mathematics confirme ce point fort sur les mathématiques. LiveBench: Coding indique aussi un niveau exploitable en programmation, sans atteindre les meilleurs modèles du panel. À sa sortie, son classement GPQA le situait dans le top 34% des LLM de sa génération, ce qui en faisait un modèle compétitif sur ce test exigeant à son époque. La licence Apache 2.0, les poids ouverts et le coût annoncé nul renforcent son intérêt pour l’expérimentation, l’auto-hébergement et les déploiements sensibles au budget.
Limites et points d'attention. Son Intelligence Index reste bas dans le classement disponible, et la moyenne globale LiveBench le place plutôt dans la seconde moitié du panel. Les scores en raisonnement, analyse de données et compréhension du langage apparaissent moins solides que son profil mathématique. Arena text le classe également loin des modèles les mieux notés en préférence utilisateur. Le modèle convient surtout à des usages où le coût, la licence ouverte, la longue fenêtre de contexte et les tâches mathématiques priment sur la performance générale de haut niveau.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai).