Qwen

Qwen: Qwen3 Coder Plus

Qwen: Qwen3 Coder Plus est un LLM édité par Qwen, sorti le 23 septembre 2025, avec des connaissances arrêtées au 2025-06-30. Il se distingue surtout par une fenêtre de contexte de 1 000 000 tokens, un format adapté aux très longs documents, aux bases de code volumineuses et aux échanges…

Son positionnement tarifaire est très économique: le prix annoncé se situe 67% sous la moyenne des LLM similaires et environ 7,4 fois sous celui des modèles frontière. Les données disponibles reposent sur 2 sources concordantes, avec des résultats Benchable particulièrement solides sur les hallucinations.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Qwen
Date de sortie	23 septembre 2025
Connaissances jusqu'à	2025-06-30
Multimodal	non
Fenêtre de contexte	1 000 000 tokens (≈ 1,0 M)
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Hallucinations (Baseline)	100,0 %	1ᵉ / 229	benchable	✅ Mesuré
Benchable : Email Classification (Baseline)	99,0 %	24ᵉ / 254	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	71,0 %	82ᵉ / 252	benchable	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Hallucinations (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

gemini-3.1-flash-image100 %

Qwen2.5 72B Instruct100 %

▶ Qwen3 Coder Plus100 %

Nemotron Nano 9B v298 %

Benchable : Email Classification (Baseline)

DeepSeek-R1100 %

Gemini 2.5 Flash-Lite100 %

GPT-4 Turbo100 %

nova-premier-v199 %

▶ Qwen3 Coder Plus99 %

WizardLM-2 8x22B95 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
Alibaba Cloud Int.	0,65 $	3,25 $	0,13 $

Prix en dollars US par million de tokens.

Sa tarification se situe 67 % en dessous de la moyenne des LLM similaires, et 7,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,03 $
Latence moyenne par benchmark — Benchable	2 min 17 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Qwen: Qwen3 Coder Plus ressort d’abord par son excellent résultat sur Hallucinations (Baseline), où il figure dans le top 10, un signal important pour les usages où la stabilité factuelle compte. Email Classification (Baseline) le place aussi dans le haut du tableau, ce qui indique une bonne aptitude aux tâches de tri et de catégorisation de messages. La très grande fenêtre de contexte constitue un autre atout concret: elle ouvre la voie à l’analyse de corpus longs sans découpage excessif. Le tarif renforce ce positionnement, avec un coût d’entrée de 0,65 $ par million de tokens et une sortie à 3,25 $, nettement inférieur à la moyenne de sa catégorie.

Limites et points d'attention. Instruction Following (Baseline) apparaît moins dominant, avec un résultat situé davantage en milieu de classement que parmi les tout meilleurs modèles évalués. Ce point compte pour les tâches qui exigent une exécution stricte de consignes complexes ou très contraintes. La date limite des connaissances, fixée au 2025-06-30, impose aussi une vigilance sur les faits postérieurs. Qwen: Qwen3 Coder Plus convient surtout aux scénarios à grand contexte, aux traitements de classification et aux usages cherchant un bon compromis entre coût bas et résultats solides sur la réduction des hallucinations.

Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).

Qwen: Qwen3 Coder Plus

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast