Z.ai: GLM 5 Turbo
GLM 5 Turbo est la déclinaison agentique de Zhipu AI (Z.ai), dérivée du modèle phare GLM-5 et sortie le 15 mars 2026, un mois après la version standard. Zhipu n'en publie pas la taille ni l'architecture exacte : c'est une variante conçue dès l'origine pour les agents, optimisée pour la…
GLM 5 Turbo est la déclinaison agentique de Zhipu AI (Z.ai), dérivée du modèle phare GLM-5 et sortie le 15 mars 2026, un mois après la version standard. Zhipu n'en publie pas la taille ni l'architecture exacte : c'est une variante conçue dès l'origine pour les agents, optimisée pour la stabilité et la fiabilité des appels d'outils sur de longues chaînes plutôt que pour le débit en un seul tour.
Fait notable, GLM 5 Turbo est fermé, en rupture avec l'ADN open-weights de Zhipu, le GLM-5 de base restant lui ouvert.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Z.ai |
| Date de sortie | 15 mars 2026 |
| Multimodal | non |
| Fenêtre de contexte | 262 144 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : Hallucinations (Baseline) | 100,0 % | 1ᵉ / 229 | benchable | ✅ Mesuré |
| Benchable : General Knowledge (Baseline) | 100,0 % | 1ᵉ / 250 | benchable | ✅ Mesuré |
| Benchable : Ethics (Baseline) | 100,0 % | 1ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Email Classification (Baseline) | 98,0 % | 90ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : Coding (Baseline) | 95,5 % | 22ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Mathematics (Baseline) | 95,0 % | 25ᵉ / 217 | benchable | ✅ Mesuré |
| Benchable : Reasoning (Baseline) | 94,0 % | 61ᵉ / 239 | benchable | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 84,0 % | 31ᵉ / 252 | benchable | ✅ Mesuré |
| PinchBench : agentique (OpenClaw, 147 tâches) | 71,8 % | 25ᵉ / 52 | pinchbench | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Benchable : Hallucinations (Baseline)
Benchable : General Knowledge (Baseline)
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| AtlasCloud | 1,2 $ | 4 $ | 0,24 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 38 % en dessous de la moyenne des LLM similaires, et 4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût par exécution agentique — PinchBench (147 tâches) | 9,3 $ |
| Durée d'exécution — PinchBench | 4 h 47 min |
| Indice valeur/coût — PinchBench | 14,99 |
| Coût moyen par benchmark — Benchable | 0,18 $ |
| Latence moyenne par benchmark — Benchable | 11 min 43 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. Sa valeur tient à l'agentique : un taux d'erreur d'appel d'outils très bas (de l'ordre de 0.7 %, contre plusieurs pour cent chez ses comparateurs) et un débit soutenu sur les longues chaînes d'actions. Le tout à un prix agressif, environ cinq fois moins cher que Claude Opus 4.6, ce qui en fait un candidat sérieux pour industrialiser des agents.
Limites et points d'attention. Le modèle est fermé et son architecture non documentée, ce qui tranche avec la tradition ouverte de l'éditeur. Étant spécialisé pour l'agentique, ses performances généralistes sont moins établies, et plusieurs de ses bons scores reposent sur des bancs maison (ZClawBench). Une partie des chiffres techniques qui lui sont prêtés proviennent en réalité du GLM-5 standard. Il vise les déploiements d'agents en production sensibles au coût.
Sources des données : OpenRouter (openrouter.ai) · PinchBench (pinchbench.com) · Benchable.ai (benchable.ai).