Qwen: Qwen3 Coder Plus
Qwen: Qwen3 Coder Plus est un LLM édité par Qwen, sorti le 23 septembre 2025, avec des connaissances arrêtées au 2025-06-30. Il se distingue surtout par une fenêtre de contexte de 1 000 000 tokens, un format adapté aux très longs documents, aux bases de code volumineuses et aux échanges…
Qwen: Qwen3 Coder Plus est un LLM édité par Qwen, sorti le 23 septembre 2025, avec des connaissances arrêtées au 2025-06-30. Il se distingue surtout par une fenêtre de contexte de 1 000 000 tokens, un format adapté aux très longs documents, aux bases de code volumineuses et aux échanges prolongés.
Son positionnement tarifaire est très économique: le prix annoncé se situe 67% sous la moyenne des LLM similaires et environ 7,4 fois sous celui des modèles frontière. Les données disponibles reposent sur 2 sources concordantes, avec des résultats Benchable particulièrement solides sur les hallucinations.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Qwen |
| Date de sortie | 23 septembre 2025 |
| Connaissances jusqu'à | 2025-06-30 |
| Multimodal | non |
| Fenêtre de contexte | 1 000 000 tokens (≈ 1,0 M) |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : Hallucinations (Baseline) | 100,0 % | 1ᵉ / 229 | benchable | ✅ Mesuré |
| Benchable : Email Classification (Baseline) | 99,0 % | 24ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 71,0 % | 82ᵉ / 252 | benchable | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Benchable : Hallucinations (Baseline)
Benchable : Email Classification (Baseline)
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Alibaba Cloud Int. | 0,65 $ | 3,25 $ | 0,13 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 67 % en dessous de la moyenne des LLM similaires, et 7,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0,03 $ |
| Latence moyenne par benchmark — Benchable | 2 min 17 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. Qwen: Qwen3 Coder Plus ressort d’abord par son excellent résultat sur Hallucinations (Baseline), où il figure dans le top 10, un signal important pour les usages où la stabilité factuelle compte. Email Classification (Baseline) le place aussi dans le haut du tableau, ce qui indique une bonne aptitude aux tâches de tri et de catégorisation de messages. La très grande fenêtre de contexte constitue un autre atout concret: elle ouvre la voie à l’analyse de corpus longs sans découpage excessif. Le tarif renforce ce positionnement, avec un coût d’entrée de 0,65 $ par million de tokens et une sortie à 3,25 $, nettement inférieur à la moyenne de sa catégorie.
Limites et points d'attention. Instruction Following (Baseline) apparaît moins dominant, avec un résultat situé davantage en milieu de classement que parmi les tout meilleurs modèles évalués. Ce point compte pour les tâches qui exigent une exécution stricte de consignes complexes ou très contraintes. La date limite des connaissances, fixée au 2025-06-30, impose aussi une vigilance sur les faits postérieurs. Qwen: Qwen3 Coder Plus convient surtout aux scénarios à grand contexte, aux traitements de classification et aux usages cherchant un bon compromis entre coût bas et résultats solides sur la réduction des hallucinations.
Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).