Anthropic

Claude Fable 5

Claude Fable 5 est un LLM propriétaire d’Anthropic, sorti le 9 juin 2026, positionné sur le segment premium. Ses poids ne sont pas ouverts et sa fenêtre de contexte atteint 1 000 000 tokens, un format adapté aux traitements longs, aux bases documentaires volumineuses et aux tâches…

Le modèle se distingue par un profil très haut de gamme en raisonnement, en code et en usage agentique. À sa sortie, il figurait dans le top 1% sur SWE-Bench Verified parmi les LLM de sa génération, ce qui le situe comme un modèle majeur de sa période.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Anthropic
Licence	Proprietary (poids non ouverts)
Date de sortie	9 juin 2026
Multimodal	oui
Fenêtre de contexte	1 000 000 tokens (≈ 1,0 M)
Modalités (entrée → sortie)	text,image → text

Indices de synthèse

Indice	Valeur	Rang (LLM)
Intelligence Index	59.9	1ᵉ / 136
Code Index	76.5	1ᵉ / 50
Agentic Index	52.8	1ᵉ / 42

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Epoch: FrontierMath-Tier-4-2025-07-01-Public	100,0 %	1ᵉ / 36	epoch	✅ Mesuré
Epoch: FrontierMath-2025-02-28-Public	100,0 %	1ᵉ / 64	epoch	✅ Mesuré
Epoch: OTIS Mock AIME 2024-2025	99,7 %	3ᵉ / 111	epoch	✅ Mesuré
LiveBench: Mathematics	93,9 %	4ᵉ / 76	livebench	✅ Mesuré
LiveBench: Language	88,5 %	1ᵉ / 76	livebench	✅ Mesuré
Epoch: FrontierMath-Tier-4-v2-Private	87,8 %	1ᵉ / 32	epoch	✅ Mesuré
LiveBench: Reasoning	87,2 %	6ᵉ / 76	livebench	✅ Mesuré
Epoch: FrontierMath-Tiers-1-3-v2-Private	87,0 %	2ᵉ / 31	epoch	✅ Mesuré
LiveBench: Data Analysis	80,0 %	2ᵉ / 76	livebench	✅ Mesuré
LiveBench: Coding	78,6 %	10ᵉ / 76	livebench	✅ Mesuré
LiveBench: Global average	78,3 %	5ᵉ / 76	livebench	✅ Mesuré
Epoch: SimpleQA Verified	68,3 %	4ᵉ / 52	epoch	✅ Mesuré
LiveBench: Agentic Coding	60,0 %	7ᵉ / 76	livebench	✅ Mesuré
LiveBench: IF	60,0 %	32ᵉ / 76	livebench	✅ Mesuré
PinchBench : agentique (OpenClaw, 147 tâches)	54,8 %	39ᵉ / 52	pinchbench	✅ Mesuré
Epoch: Chess Puzzles	41,0 %	8ᵉ / 43	epoch	✅ Mesuré
SWE-Bench Verified	95,0 %	1ᵉ / 100	llm-stats	Auto-déclaré
FrontierSWE	90,0 %	1ᵉ / 13	llm-stats	n.d.
OSWorld-Verified	85,0 %	1ᵉ / 17	llm-stats	Auto-déclaré
Terminal-Bench 2.1	84,3 %	1ᵉ / 6	llm-stats	Auto-déclaré
SWE-Bench Pro	80,0 %	1ᵉ / 34	llm-stats	Auto-déclaré
LiveBench	78,3 %	5ᵉ / 38	llm-stats	n.d.
HealthBench Professional	66,0 %	1ᵉ / 4	llm-stats	Auto-déclaré
Humanity's Last Exam	64,5 %	2ᵉ / 86	llm-stats	Auto-déclaré
GDPval-AA	60,5 %	1ᵉ / 33	llm-stats	n.d.
Finance Agent v2	56,3 %	2ᵉ / 25	llm-stats	n.d.
Legal Agent Benchmark	13,3 %	1ᵉ / 11	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

▶ Claude Fable 559.9

GPT-5.451.4

Gemini 3.1 Pro Preview46.5

Code Index

▶ Claude Fable 576.5

GPT-5.471.1

Gemini 3.5 Flash70.1

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Code	1654	1ᵉ
Arena Text	1508	1ᵉ
Arena Document	1495	5ᵉ
Arena Vision	1311	1ᵉ
Arena Search	1237	3ᵉ

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
Claude Platform on AWS	10 $	50 $	1 $

Prix en dollars US par million de tokens.

Sa tarification se situe 413 % au-dessus de la moyenne des LLM similaires, et 5,2 fois plus cher que les modèles frontières (GPT-5.4, Gemini 3.1 Pro Preview, Qwen3.7 Max).

Coût & vitesse agentiques

Indicateur	Valeur
Coût par exécution agentique — PinchBench (147 tâches)	123,3 $
Durée d'exécution — PinchBench	3 h 33 min
Indice valeur/coût — PinchBench	0,52

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Entraînement & empreinte

Indicateur	Valeur
Pays	United States of America

Notre analyse

Forces. Claude Fable 5 ressort particulièrement sur les mathématiques avancées, avec des résultats de premier plan sur FrontierMath, y compris sur des variantes publiques et privées centrées sur des problèmes de recherche très difficiles. Il se place aussi dans le haut du classement sur LiveBench: Language, signe d’une forte compréhension du langage, et domine les classements Arena Code et Arena Text. Son Code Index et son Agentic Index le situent parmi les meilleurs modèles comparés, ce qui indique un profil solide pour la programmation, le raisonnement structuré et les enchaînements de tâches. La fenêtre de contexte de 1 000 000 tokens renforce son intérêt pour l’analyse de grands corpus et les dossiers longs.

Limites et points d'attention. Claude Fable 5 est un modèle propriétaire, sans poids ouverts, ce qui limite l’audit indépendant, l’auto-hébergement et les adaptations internes fines. Son tarif le place nettement dans le haut du marché: il coûte 413% au-dessus de la moyenne des LLM similaires et environ 5,2 fois plus cher que les modèles frontière comparés dans la section Tarifs. Cette tarification premium impose de réserver son usage aux tâches où ses performances en code, mathématiques, langage ou contexte long justifient le surcoût. La couverture repose sur 7 sources concordantes, un socle correct, mais les arbitrages opérationnels restent dépendants du coût par volume traité.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0 · PinchBench (pinchbench.com).