Qwen: Qwen3 Coder Plus

Qwen: Qwen3 Coder Plus est un LLM édité par Qwen, sorti le 23 septembre 2025, avec des connaissances arrêtées au 2025-06-30. Il se distingue surtout par une fenêtre de contexte de 1 000 000 tokens, un format adapté aux très longs documents, aux bases de code volumineuses et aux échanges…

Qwen: Qwen3 Coder Plus est un LLM édité par Qwen, sorti le 23 septembre 2025, avec des connaissances arrêtées au 2025-06-30. Il se distingue surtout par une fenêtre de contexte de 1 000 000 tokens, un format adapté aux très longs documents, aux bases de code volumineuses et aux échanges prolongés.

Son positionnement tarifaire est très économique: le prix annoncé se situe 67% sous la moyenne des LLM similaires et environ 7,4 fois sous celui des modèles frontière. Les données disponibles reposent sur 2 sources concordantes, avec des résultats Benchable particulièrement solides sur les hallucinations.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
Date de sortie23 septembre 2025
Connaissances jusqu'à2025-06-30
Multimodalnon
Fenêtre de contexte1 000 000 tokens (≈ 1,0 M)
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Hallucinations (Baseline)100,0 %1ᵉ / 229benchable✅ Mesuré
Benchable : Email Classification (Baseline)99,0 %24ᵉ / 254benchable✅ Mesuré
Benchable : Instruction Following (Baseline)71,0 %82ᵉ / 252benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Hallucinations (Baseline)

▶ Qwen3 Coder Plus100 %

Benchable : Email Classification (Baseline)

▶ Qwen3 Coder Plus99 %
WizardLM-2 8x22B95 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Alibaba Cloud Int.0,65 $3,25 $0,13 $

Prix en dollars US par million de tokens.

Sa tarification se situe 67 % en dessous de la moyenne des LLM similaires, et 7,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,03 $
Latence moyenne par benchmark — Benchable2 min 17 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Qwen: Qwen3 Coder Plus ressort d’abord par son excellent résultat sur Hallucinations (Baseline), où il figure dans le top 10, un signal important pour les usages où la stabilité factuelle compte. Email Classification (Baseline) le place aussi dans le haut du tableau, ce qui indique une bonne aptitude aux tâches de tri et de catégorisation de messages. La très grande fenêtre de contexte constitue un autre atout concret: elle ouvre la voie à l’analyse de corpus longs sans découpage excessif. Le tarif renforce ce positionnement, avec un coût d’entrée de 0,65 $ par million de tokens et une sortie à 3,25 $, nettement inférieur à la moyenne de sa catégorie.

Limites et points d'attention. Instruction Following (Baseline) apparaît moins dominant, avec un résultat situé davantage en milieu de classement que parmi les tout meilleurs modèles évalués. Ce point compte pour les tâches qui exigent une exécution stricte de consignes complexes ou très contraintes. La date limite des connaissances, fixée au 2025-06-30, impose aussi une vigilance sur les faits postérieurs. Qwen: Qwen3 Coder Plus convient surtout aux scénarios à grand contexte, aux traitements de classification et aux usages cherchant un bon compromis entre coût bas et résultats solides sur la réduction des hallucinations.


Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).