Claude Fable 5

Claude Fable 5 est un LLM propriétaire d’Anthropic, sorti le 9 juin 2026, positionné sur le segment premium. Ses poids ne sont pas ouverts et sa fenêtre de contexte atteint 1 000 000 tokens, un format adapté aux traitements longs, aux bases documentaires volumineuses et aux tâches…

Claude Fable 5 est un LLM propriétaire d’Anthropic, sorti le 9 juin 2026, positionné sur le segment premium. Ses poids ne sont pas ouverts et sa fenêtre de contexte atteint 1 000 000 tokens, un format adapté aux traitements longs, aux bases documentaires volumineuses et aux tâches nécessitant une continuité étendue.

Le modèle se distingue par un profil très haut de gamme en raisonnement, en code et en usage agentique. À sa sortie, il figurait dans le top 1% sur SWE-Bench Verified parmi les LLM de sa génération, ce qui le situe comme un modèle majeur de sa période.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurAnthropic
LicenceProprietary (poids non ouverts)
Date de sortie9 juin 2026
Multimodaloui
Fenêtre de contexte1 000 000 tokens (≈ 1,0 M)
Modalités (entrée → sortie)text,image → text

Indices de synthèse

IndiceValeurRang (LLM)
Intelligence Index59.91ᵉ / 136
Code Index76.51ᵉ / 50
Agentic Index52.81ᵉ / 42

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: FrontierMath-Tier-4-2025-07-01-Public100,0 %1ᵉ / 36epoch✅ Mesuré
Epoch: FrontierMath-2025-02-28-Public100,0 %1ᵉ / 64epoch✅ Mesuré
Epoch: OTIS Mock AIME 2024-202599,7 %3ᵉ / 111epoch✅ Mesuré
LiveBench: Mathematics93,9 %4ᵉ / 76livebench✅ Mesuré
LiveBench: Language88,5 %1ᵉ / 76livebench✅ Mesuré
Epoch: FrontierMath-Tier-4-v2-Private87,8 %1ᵉ / 32epoch✅ Mesuré
LiveBench: Reasoning87,2 %6ᵉ / 76livebench✅ Mesuré
Epoch: FrontierMath-Tiers-1-3-v2-Private87,0 %2ᵉ / 31epoch✅ Mesuré
LiveBench: Data Analysis80,0 %2ᵉ / 76livebench✅ Mesuré
LiveBench: Coding78,6 %10ᵉ / 76livebench✅ Mesuré
LiveBench: Global average78,3 %5ᵉ / 76livebench✅ Mesuré
Epoch: SimpleQA Verified68,3 %4ᵉ / 52epoch✅ Mesuré
LiveBench: Agentic Coding60,0 %7ᵉ / 76livebench✅ Mesuré
LiveBench: IF60,0 %32ᵉ / 76livebench✅ Mesuré
PinchBench : agentique (OpenClaw, 147 tâches)54,8 %39ᵉ / 52pinchbench✅ Mesuré
Epoch: Chess Puzzles41,0 %8ᵉ / 43epoch✅ Mesuré
SWE-Bench Verified95,0 %1ᵉ / 100llm-statsAuto-déclaré
FrontierSWE90,0 %1ᵉ / 13llm-statsn.d.
OSWorld-Verified85,0 %1ᵉ / 17llm-statsAuto-déclaré
Terminal-Bench 2.184,3 %1ᵉ / 6llm-statsAuto-déclaré
SWE-Bench Pro80,0 %1ᵉ / 34llm-statsAuto-déclaré
LiveBench78,3 %5ᵉ / 38llm-statsn.d.
HealthBench Professional66,0 %1ᵉ / 4llm-statsAuto-déclaré
Humanity's Last Exam64,5 %2ᵉ / 86llm-statsAuto-déclaré
GDPval-AA60,5 %1ᵉ / 33llm-statsn.d.
Finance Agent v256,3 %2ᵉ / 25llm-statsn.d.
Legal Agent Benchmark13,3 %1ᵉ / 11llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

▶ Claude Fable 559.9
GPT-5.451.4
Gemini 3.1 Pro Preview46.5

Code Index

▶ Claude Fable 576.5
GPT-5.471.1
Gemini 3.5 Flash70.1

Classements Arena (Elo)

CatégorieEloRang
Arena Code16541ᵉ
Arena Text15081ᵉ
Arena Document14955ᵉ
Arena Vision13111ᵉ
Arena Search12373ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Claude Platform on AWS10 $50 $1 $

Prix en dollars US par million de tokens.

Sa tarification se situe 413 % au-dessus de la moyenne des LLM similaires, et 5,2 fois plus cher que les modèles frontières (GPT-5.4, Gemini 3.1 Pro Preview, Qwen3.7 Max).

Coût & vitesse agentiques

IndicateurValeur
Coût par exécution agentique — PinchBench (147 tâches)123,3 $
Durée d'exécution — PinchBench3 h 33 min
Indice valeur/coût — PinchBench0,52

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Entraînement & empreinte

IndicateurValeur
PaysUnited States of America

Notre analyse

Forces. Claude Fable 5 ressort particulièrement sur les mathématiques avancées, avec des résultats de premier plan sur FrontierMath, y compris sur des variantes publiques et privées centrées sur des problèmes de recherche très difficiles. Il se place aussi dans le haut du classement sur LiveBench: Language, signe d’une forte compréhension du langage, et domine les classements Arena Code et Arena Text. Son Code Index et son Agentic Index le situent parmi les meilleurs modèles comparés, ce qui indique un profil solide pour la programmation, le raisonnement structuré et les enchaînements de tâches. La fenêtre de contexte de 1 000 000 tokens renforce son intérêt pour l’analyse de grands corpus et les dossiers longs.

Limites et points d'attention. Claude Fable 5 est un modèle propriétaire, sans poids ouverts, ce qui limite l’audit indépendant, l’auto-hébergement et les adaptations internes fines. Son tarif le place nettement dans le haut du marché: il coûte 413% au-dessus de la moyenne des LLM similaires et environ 5,2 fois plus cher que les modèles frontière comparés dans la section Tarifs. Cette tarification premium impose de réserver son usage aux tâches où ses performances en code, mathématiques, langage ou contexte long justifient le surcoût. La couverture repose sur 7 sources concordantes, un socle correct, mais les arbitrages opérationnels restent dépendants du coût par volume traité.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0 · PinchBench (pinchbench.com).