Qwen

Qwen: Qwen3 30B A3B Instruct 2507

Qwen: Qwen3 30B A3B Instruct 2507 est un LLM de Qwen sorti le 29 juillet 2025, avec des connaissances arrêtées au 2025-06-30. Sa fiche se distingue par une très grande fenêtre de contexte de 131 072 tokens et par un positionnement tarifaire très économique.

Le modèle apparaît comme une option orientée coût, avec des prix annoncés très inférieurs à la moyenne des LLM similaires et environ 100,4 fois plus bas que ceux des modèles frontière. Les données disponibles reposent sur 3 sources concordantes.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Qwen
Date de sortie	29 juillet 2025
Connaissances jusqu'à	2025-06-30
Multimodal	non
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Keyword Topic Relevance Classification	100,0 %	1ᵉ / 9	benchable	✅ Mesuré
Benchable : Ethics (Baseline)	100,0 %	1ᵉ / 248	benchable	✅ Mesuré
Benchable : Hallucinations (Baseline)	98,0 %	71ᵉ / 229	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	97,0 %	158ᵉ / 250	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	94,0 %	42ᵉ / 217	benchable	✅ Mesuré
Benchable : Email Classification (Baseline)	94,0 %	217ᵉ / 254	benchable	✅ Mesuré
Benchable : Coding (Baseline)	93,0 %	58ᵉ / 248	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	78,0 %	124ᵉ / 239	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	59,8 %	146ᵉ / 252	benchable	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Keyword Topic Relevance Classification

GPT OSS 20B100 %

qwen3-235b-a22b-07-25100 %

▶ Qwen3 30B A3B Ins…100 %

Benchable : Ethics (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

Gemini 2.5 Flash Lite P…100 %

Qwen2.5 72B Instruct100 %

▶ Qwen3 30B A3B Ins…100 %

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1383	142ᵉ

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
StreamLake	0,04815 $	0,19305 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 98 % en dessous de la moyenne des LLM similaires, et 100,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,01 $
Latence moyenne par benchmark — Benchable	3 min 16 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Qwen: Qwen3 30B A3B Instruct 2507 se démarque surtout sur les tâches de classification et de conformité de réponse. Il atteint le top 10 sur Keyword Topic Relevance Classification et Ethics (Baseline), deux signaux favorables pour le tri thématique, l’étiquetage de contenus et les usages nécessitant une bonne stabilité comportementale. Le résultat en Mathematics (Baseline) le place aussi dans une zone solide, utile pour des raisonnements quantitatifs courants. Le score élevé en Hallucinations (Baseline) indique une bonne maîtrise relative de la fiabilité factuelle dans ce protocole, même si son rang n’est pas parmi les tout premiers. Son autre atout majeur reste économique: la tarification est très inférieure à celle des LLM comparables et nettement sous les modèles haut de gamme.

Limites et points d'attention. Le classement Arena text reste éloigné des meilleurs modèles conversationnels, ce qui suggère une compétitivité plus limitée en dialogue général ouvert. General Knowledge (Baseline) affiche un bon score brut, mais un rang de milieu de tableau, signe que beaucoup de modèles font mieux sur ce terrain. Email Classification (Baseline) est également moins différenciant malgré un score élevé, avec un rang faible par rapport au nombre de modèles évalués. Les connaissances s’arrêtent au 2025-06-30, ce qui impose une vigilance sur les faits récents. Le modèle convient surtout aux traitements à grand contexte, aux classifications, aux usages sensibles au coût et aux tâches où le prix par token compte davantage que la performance conversationnelle maximale.

Sources des données : OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Benchable.ai (benchable.ai).

Qwen: Qwen3 30B A3B Instruct 2507

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Classements Arena (Elo)

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast