Z.ai

Z.ai: GLM 5 Turbo

GLM 5 Turbo est la déclinaison agentique de Zhipu AI (Z.ai), dérivée du modèle phare GLM-5 et sortie le 15 mars 2026, un mois après la version standard. Zhipu n'en publie pas la taille ni l'architecture exacte : c'est une variante conçue dès l'origine pour les agents, optimisée pour la…

Fait notable, GLM 5 Turbo est fermé, en rupture avec l'ADN open-weights de Zhipu, le GLM-5 de base restant lui ouvert.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Z.ai
Date de sortie	15 mars 2026
Multimodal	non
Fenêtre de contexte	262 144 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Hallucinations (Baseline)	100,0 %	1ᵉ / 229	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	100,0 %	1ᵉ / 250	benchable	✅ Mesuré
Benchable : Ethics (Baseline)	100,0 %	1ᵉ / 248	benchable	✅ Mesuré
Benchable : Email Classification (Baseline)	98,0 %	90ᵉ / 254	benchable	✅ Mesuré
Benchable : Coding (Baseline)	95,5 %	22ᵉ / 248	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	95,0 %	25ᵉ / 217	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	94,0 %	61ᵉ / 239	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	84,0 %	31ᵉ / 252	benchable	✅ Mesuré
PinchBench : agentique (OpenClaw, 147 tâches)	71,8 %	25ᵉ / 52	pinchbench	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Hallucinations (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

gemini-3.1-flash-image100 %

Qwen2.5 72B Instruct100 %

▶ GLM 5 Turbo100 %

Nemotron Nano 9B v298 %

Benchable : General Knowledge (Baseline)

Claude Opus 4100 %

Gemini 2.5 Flash100 %

GPT-5100 %

qwen3-235b-a22b-04-28100 %

▶ GLM 5 Turbo100 %

DeepSeek R1 Distill Lla…100 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
AtlasCloud	1,2 $	4 $	0,24 $

Prix en dollars US par million de tokens.

Sa tarification se situe 38 % en dessous de la moyenne des LLM similaires, et 4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût par exécution agentique — PinchBench (147 tâches)	9,3 $
Durée d'exécution — PinchBench	4 h 47 min
Indice valeur/coût — PinchBench	14,99
Coût moyen par benchmark — Benchable	0,18 $
Latence moyenne par benchmark — Benchable	11 min 43 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Sa valeur tient à l'agentique : un taux d'erreur d'appel d'outils très bas (de l'ordre de 0.7 %, contre plusieurs pour cent chez ses comparateurs) et un débit soutenu sur les longues chaînes d'actions. Le tout à un prix agressif, environ cinq fois moins cher que Claude Opus 4.6, ce qui en fait un candidat sérieux pour industrialiser des agents.

Limites et points d'attention. Le modèle est fermé et son architecture non documentée, ce qui tranche avec la tradition ouverte de l'éditeur. Étant spécialisé pour l'agentique, ses performances généralistes sont moins établies, et plusieurs de ses bons scores reposent sur des bancs maison (ZClawBench). Une partie des chiffres techniques qui lui sont prêtés proviennent en réalité du GLM-5 standard. Il vise les déploiements d'agents en production sensibles au coût.

Sources des données : OpenRouter (openrouter.ai) · PinchBench (pinchbench.com) · Benchable.ai (benchable.ai).

Z.ai: GLM 5 Turbo

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast