qwen3-30b-a3b-04-28

qwen3-30b-a3b-04-28 est un LLM édité par Qwen. La fiche le situe à partir de Benchable, où il ressort surtout par ses résultats en General Knowledge (Baseline) et en Ethics (Baseline), deux évaluations sur lesquelles il atteint le tout premier rang du classement disponible.

qwen3-30b-a3b-04-28 est un LLM édité par Qwen. La fiche le situe à partir de Benchable, où il ressort surtout par ses résultats en General Knowledge (Baseline) et en Ethics (Baseline), deux évaluations sur lesquelles il atteint le tout premier rang du classement disponible.

Le modèle affiche aussi un profil équilibré sur des tâches plus opérationnelles, avec de bons classements en Email Classification, Reasoning et Coding. La lecture doit toutefois rester prudente, car les données vérifiées reposent sur une seule source concordante et ne fournissent pas d'éléments sur l'entraînement, le coût, le contexte ou les modalités d'accès.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurQwen

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : General Knowledge (Baseline)100,0 %1ᵉ / 250benchable✅ Mesuré
Benchable : Ethics (Baseline)100,0 %1ᵉ / 248benchable✅ Mesuré
Benchable : Email Classification (Baseline)99,0 %24ᵉ / 254benchable✅ Mesuré
Benchable : Hallucinations (Baseline)96,0 %102ᵉ / 229benchable✅ Mesuré
Benchable : Reasoning (Baseline)96,0 %39ᵉ / 239benchable✅ Mesuré
Benchable : Coding (Baseline)94,0 %38ᵉ / 248benchable✅ Mesuré
Benchable : Mathematics (Baseline)93,0 %67ᵉ / 217benchable✅ Mesuré
Benchable : Instruction Following (Baseline)60,8 %138ᵉ / 252benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : General Knowledge (Baseline)

GPT-5100 %
▶ qwen3-30b-a3b-04-28100 %

Benchable : Ethics (Baseline)

▶ qwen3-30b-a3b-04-28100 %

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,02 $
Latence moyenne par benchmark — Benchable19 min 32 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. qwen3-30b-a3b-04-28 se distingue d'abord sur General Knowledge (Baseline) et Ethics (Baseline), où il figure dans le top 10 et atteint le rang le plus élevé du panel Benchable. Ce double résultat indique un modèle particulièrement solide sur les connaissances générales et les réponses évaluées sous l'angle éthique. Il reste également bien placé en Email Classification (Baseline), un test utile pour apprécier la capacité à catégoriser des messages. Les performances en Reasoning (Baseline) et Coding (Baseline) le placent aussi dans une zone compétitive du classement, sans se limiter à un seul type de tâche.

Limites et points d'attention. Le benchmark Hallucinations (Baseline) est moins distinctif dans le classement, avec une position située plus près du milieu de tableau que de ses meilleurs résultats. Le score brut reste élevé, mais le rang montre que d'autres modèles du panel font mieux sur cet axe. La couverture documentaire est limitée à 1 source de données concordante, ce qui réduit la profondeur d'analyse possible. Aucune donnée vérifiée n'indique le volume d'entraînement, le coût, la taille de contexte, les tarifs, les licences ou les conditions de déploiement, autant de critères nécessaires pour juger son intérêt pratique au-delà des benchmarks disponibles.


Sources des données : Benchable.ai (benchable.ai).