Anthropic

Claude Mythos Preview

Claude Mythos Preview est un LLM propriétaire d’Anthropic, présenté sous une appellation « Preview » qui le situe comme une version non qualifiée ici de modèle final.

La fiche disponible repose sur une seule source de données concordante. Les poids ne sont pas ouverts, ce qui place Claude Mythos Preview dans la catégorie des modèles fermés, avec une évaluation dépendante des informations publiquement disponibles.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Anthropic
Licence	Proprietary (poids non ouverts)
Multimodal	oui
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
USAMO25	97,6 %	1ᵉ / 3	llm-stats	Auto-déclaré
GPQA	94,6 %	1ᵉ / 213	llm-stats	Auto-déclaré
SWE-Bench Verified	93,9 %	2ᵉ / 100	llm-stats	Auto-déclaré
CharXiv-R	93,2 %	1ᵉ / 42	llm-stats	Auto-déclaré
MMMLU	92,7 %	1ᵉ / 49	llm-stats	Auto-déclaré
FigQA	89,0 %	1ᵉ / 3	llm-stats	Auto-déclaré
SWE-bench Multilingual	87,3 %	1ᵉ / 32	llm-stats	Auto-déclaré
BrowseComp	86,9 %	2ᵉ / 51	llm-stats	Auto-déclaré
CyberGym	83,1 %	1ᵉ / 9	llm-stats	Auto-déclaré
Terminal-Bench 2.0	82,0 %	2ᵉ / 48	llm-stats	Auto-déclaré
Graphwalks BFS >128k	80,0 %	1ᵉ / 8	llm-stats	Auto-déclaré
OSWorld-Verified	79,6 %	3ᵉ / 17	llm-stats	Auto-déclaré
SWE-Bench Pro	77,8 %	2ᵉ / 34	llm-stats	Auto-déclaré
Humanity's Last Exam	64,7 %	1ᵉ / 86	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Claude Mythos Preview bénéficie d’un positionnement clair dans l’écosystème Anthropic : il s’agit d’un LLM propriétaire, associé à un éditeur spécialisé dans les modèles de langage. La mention « Preview » apporte une information utile sur son statut, en signalant une version présentée comme préliminaire ou d’aperçu plutôt qu’un modèle documenté comme stable dans les données disponibles.

Limites et points d'attention. Les données vérifiées ne fournissent aucun benchmark, aucun tarif, aucune date de sortie, aucun détail d’entraînement et aucune indication de contexte d’usage. L’analyse de ses performances reste donc impossible à établir de manière factuelle. La licence propriétaire et l’absence d’ouverture des poids limitent aussi l’examen indépendant du modèle. La couverture repose sur une seule source concordante, ce qui invite à traiter la fiche comme une entrée encore peu documentée plutôt que comme un profil technique complet.

Sources des données : LLM-Stats (llm-stats.com).

Claude Mythos Preview

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast