Qwen: Qwen3 30B A3B Instruct 2507

Qwen: Qwen3 30B A3B Instruct 2507 est un LLM de Qwen sorti le 29 juillet 2025, avec des connaissances arrêtées au 2025-06-30. Sa fiche se distingue par une très grande fenêtre de contexte de 131 072 tokens et par un positionnement tarifaire très économique.

Qwen: Qwen3 30B A3B Instruct 2507 est un LLM de Qwen sorti le 29 juillet 2025, avec des connaissances arrêtées au 2025-06-30. Sa fiche se distingue par une très grande fenêtre de contexte de 131 072 tokens et par un positionnement tarifaire très économique.

Le modèle apparaît comme une option orientée coût, avec des prix annoncés très inférieurs à la moyenne des LLM similaires et environ 100,4 fois plus bas que ceux des modèles frontière. Les données disponibles reposent sur 3 sources concordantes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen
Date de sortie29 juillet 2025
Connaissances jusqu'à2025-06-30
Multimodalnon
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Keyword Topic Relevance Classification100,0 %1ᵉ / 9benchable✅ Mesuré
Benchable : Ethics (Baseline)100,0 %1ᵉ / 248benchable✅ Mesuré
Benchable : Hallucinations (Baseline)98,0 %71ᵉ / 229benchable✅ Mesuré
Benchable : General Knowledge (Baseline)97,0 %158ᵉ / 250benchable✅ Mesuré
Benchable : Mathematics (Baseline)94,0 %42ᵉ / 217benchable✅ Mesuré
Benchable : Email Classification (Baseline)94,0 %217ᵉ / 254benchable✅ Mesuré
Benchable : Coding (Baseline)93,0 %58ᵉ / 248benchable✅ Mesuré
Benchable : Reasoning (Baseline)78,0 %124ᵉ / 239benchable✅ Mesuré
Benchable : Instruction Following (Baseline)59,8 %146ᵉ / 252benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Keyword Topic Relevance Classification

▶ Qwen3 30B A3B Ins…100 %

Benchable : Ethics (Baseline)

▶ Qwen3 30B A3B Ins…100 %

Classements Arena (Elo)

CatégorieEloRang
Arena Text1383142ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
StreamLake0,04815 $0,19305 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 98 % en dessous de la moyenne des LLM similaires, et 100,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,01 $
Latence moyenne par benchmark — Benchable3 min 16 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Qwen: Qwen3 30B A3B Instruct 2507 se démarque surtout sur les tâches de classification et de conformité de réponse. Il atteint le top 10 sur Keyword Topic Relevance Classification et Ethics (Baseline), deux signaux favorables pour le tri thématique, l’étiquetage de contenus et les usages nécessitant une bonne stabilité comportementale. Le résultat en Mathematics (Baseline) le place aussi dans une zone solide, utile pour des raisonnements quantitatifs courants. Le score élevé en Hallucinations (Baseline) indique une bonne maîtrise relative de la fiabilité factuelle dans ce protocole, même si son rang n’est pas parmi les tout premiers. Son autre atout majeur reste économique: la tarification est très inférieure à celle des LLM comparables et nettement sous les modèles haut de gamme.

Limites et points d'attention. Le classement Arena text reste éloigné des meilleurs modèles conversationnels, ce qui suggère une compétitivité plus limitée en dialogue général ouvert. General Knowledge (Baseline) affiche un bon score brut, mais un rang de milieu de tableau, signe que beaucoup de modèles font mieux sur ce terrain. Email Classification (Baseline) est également moins différenciant malgré un score élevé, avec un rang faible par rapport au nombre de modèles évalués. Les connaissances s’arrêtent au 2025-06-30, ce qui impose une vigilance sur les faits récents. Le modèle convient surtout aux traitements à grand contexte, aux classifications, aux usages sensibles au coût et aux tâches où le prix par token compte davantage que la performance conversationnelle maximale.


Sources des données : OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Benchable.ai (benchable.ai).