Z.ai: GLM 5 Turbo

GLM 5 Turbo est la déclinaison agentique de Zhipu AI (Z.ai), dérivée du modèle phare GLM-5 et sortie le 15 mars 2026, un mois après la version standard. Zhipu n'en publie pas la taille ni l'architecture exacte : c'est une variante conçue dès l'origine pour les agents, optimisée pour la…

GLM 5 Turbo est la déclinaison agentique de Zhipu AI (Z.ai), dérivée du modèle phare GLM-5 et sortie le 15 mars 2026, un mois après la version standard. Zhipu n'en publie pas la taille ni l'architecture exacte : c'est une variante conçue dès l'origine pour les agents, optimisée pour la stabilité et la fiabilité des appels d'outils sur de longues chaînes plutôt que pour le débit en un seul tour.

Fait notable, GLM 5 Turbo est fermé, en rupture avec l'ADN open-weights de Zhipu, le GLM-5 de base restant lui ouvert.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurZ.ai
Date de sortie15 mars 2026
Multimodalnon
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Hallucinations (Baseline)100,0 %1ᵉ / 229benchable✅ Mesuré
Benchable : General Knowledge (Baseline)100,0 %1ᵉ / 250benchable✅ Mesuré
Benchable : Ethics (Baseline)100,0 %1ᵉ / 248benchable✅ Mesuré
Benchable : Email Classification (Baseline)98,0 %90ᵉ / 254benchable✅ Mesuré
Benchable : Coding (Baseline)95,5 %22ᵉ / 248benchable✅ Mesuré
Benchable : Mathematics (Baseline)95,0 %25ᵉ / 217benchable✅ Mesuré
Benchable : Reasoning (Baseline)94,0 %61ᵉ / 239benchable✅ Mesuré
Benchable : Instruction Following (Baseline)84,0 %31ᵉ / 252benchable✅ Mesuré
PinchBench : agentique (OpenClaw, 147 tâches)71,8 %25ᵉ / 52pinchbench✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Hallucinations (Baseline)

Qwen2.5 72B Instruct100 %
▶ GLM 5 Turbo100 %
Nemotron Nano 9B v298 %

Benchable : General Knowledge (Baseline)

GPT-5100 %
qwen3-235b-a22b-04-28100 %
▶ GLM 5 Turbo100 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
AtlasCloud1,2 $4 $0,24 $

Prix en dollars US par million de tokens.

Sa tarification se situe 38 % en dessous de la moyenne des LLM similaires, et 4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût par exécution agentique — PinchBench (147 tâches)9,3 $
Durée d'exécution — PinchBench4 h 47 min
Indice valeur/coût — PinchBench14,99
Coût moyen par benchmark — Benchable0,18 $
Latence moyenne par benchmark — Benchable11 min 43 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Sa valeur tient à l'agentique : un taux d'erreur d'appel d'outils très bas (de l'ordre de 0.7 %, contre plusieurs pour cent chez ses comparateurs) et un débit soutenu sur les longues chaînes d'actions. Le tout à un prix agressif, environ cinq fois moins cher que Claude Opus 4.6, ce qui en fait un candidat sérieux pour industrialiser des agents.

Limites et points d'attention. Le modèle est fermé et son architecture non documentée, ce qui tranche avec la tradition ouverte de l'éditeur. Étant spécialisé pour l'agentique, ses performances généralistes sont moins établies, et plusieurs de ses bons scores reposent sur des bancs maison (ZClawBench). Une partie des chiffres techniques qui lui sont prêtés proviennent en réalité du GLM-5 standard. Il vise les déploiements d'agents en production sensibles au coût.


Sources des données : OpenRouter (openrouter.ai) · PinchBench (pinchbench.com) · Benchable.ai (benchable.ai).