Qwen3-Coder 480B A35B Instruct
Qwen3-Coder 480B A35B Instruct est un LLM de Qwen orienté code, publié le 31 janvier 2025 sous licence Apache 2.0 avec poids ouverts et usage commercial autorisé. Avec environ un an d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, à replacer surtout face…
Qwen3-Coder 480B A35B Instruct est un LLM de Qwen orienté code, publié le 31 janvier 2025 sous licence Apache 2.0 avec poids ouverts et usage commercial autorisé. Avec environ un an d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, à replacer surtout face aux modèles disponibles autour de sa sortie.
Le modèle se distingue par une très grande fenêtre de contexte, proche de 1,0 M de tokens, et par un format massif de 480 milliards de paramètres dont 35 milliards actifs. Son positionnement tarifaire est extrêmement économique, avec un coût indiqué comme gratuit et 100% inférieur à la moyenne des LLM similaires.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 31 janvier 2025 |
| Connaissances jusqu'à | 2025-06-30 |
| Multimodal | non |
| Paramètres | 480 milliards |
| Paramètres actifs | 35 milliards |
| Fenêtre de contexte | 1 048 576 tokens (≈ 1,0 M) |
| Modalités (entrée → sortie) | text → text |
Indices de synthèse
| Indice | Valeur | Rang (LLM) |
|---|---|---|
| Intelligence Index | 18.0 | 107ᵉ / 136 |
| Math Index | 39.3 | 37ᵉ / 55 |
Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| TAU-bench Retail | 77,5 % | 8ᵉ / 24 | llm-stats | Auto-déclaré |
| SWE-Bench Verified | 69,6 % | 57ᵉ / 100 | llm-stats | Auto-déclaré |
| BFCL-v3 | 68,7 % | 12ᵉ / 19 | llm-stats | Auto-déclaré |
| Aider-Polyglot | 61,8 % | 11ᵉ / 22 | llm-stats | Auto-déclaré |
| TAU-bench Airline | 60,0 % | 4ᵉ / 22 | llm-stats | Auto-déclaré |
| MM-Mind2Web | 55,8 % | 3ᵉ / 3 | llm-stats | Auto-déclaré |
| SWE-bench Multilingual | 54,7 % | 26ᵉ / 32 | llm-stats | Auto-déclaré |
| Terminal-Bench 2.0 | 37,5 % | 46ᵉ / 48 | llm-stats | Auto-déclaré |
| Multi-SWE-Bench | 25,8 % | 6ᵉ / 6 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Intelligence Index
Math Index
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1388 | 136ᵉ |
| Arena Code | 1282 | 73ᵉ |
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Venice (Beta) | gratuit | gratuit | n.d. |
| Google Vertex | 0,22 $ | 1,8 $ | n.d. |
| artificialanalysis | 0,3 $ | 1,8 $ | 0,3 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.
Notre analyse
Forces. À sa sortie, Qwen3-Coder 480B A35B Instruct figurait dans le haut du panier de sa génération sur SWE-Bench Verified, un benchmark centré sur la résolution de problèmes logiciels réels. Cette donnée situe le modèle comme une option compétitive pour le code dans son contexte historique, davantage que comme un modèle généraliste dominant. Sa fenêtre de contexte très étendue constitue aussi un atout concret pour traiter de longs dépôts, de grandes bases documentaires ou des échanges volumineux. La licence Apache 2.0 renforce son intérêt pratique, car les poids ouverts et l’usage commercial autorisé facilitent l’intégration dans des environnements contrôlés. Son tarif, très en dessous de la moyenne des modèles comparables, en fait aussi un modèle remarquable sur le critère coût.
Limites et points d'attention. Son ancienneté pèse fortement : environ un an représente un écart très long dans l’IA générative, et ses performances sont aujourd’hui largement dépassées par les modèles haut de gamme récents. Les classements globaux le placent plutôt loin des meilleurs sur l’Intelligence Index et l’Arena text, ce qui limite son intérêt comme assistant généraliste. Même en code, son Arena code ne le situe pas au niveau des références actuelles. Le modèle est donc surtout pertinent comme point de comparaison historique ou comme option open-weights très économique, mais il est souvent retiré des catalogues d’éditeurs à ce stade de cycle. Aucun chiffre vérifié de compute ou de coût d’entraînement n’est disponible dans les données retenues.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Arena.ai (arena.ai).