Claude Mythos Preview

Claude Mythos Preview est un LLM propriétaire d’Anthropic, présenté sous une appellation « Preview » qui le situe comme une version non qualifiée ici de modèle final.

Claude Mythos Preview est un LLM propriétaire d’Anthropic, présenté sous une appellation « Preview » qui le situe comme une version non qualifiée ici de modèle final.

La fiche disponible repose sur une seule source de données concordante. Les poids ne sont pas ouverts, ce qui place Claude Mythos Preview dans la catégorie des modèles fermés, avec une évaluation dépendante des informations publiquement disponibles.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurAnthropic
LicenceProprietary (poids non ouverts)
Multimodaloui
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
USAMO2597,6 %1ᵉ / 3llm-statsAuto-déclaré
GPQA94,6 %1ᵉ / 213llm-statsAuto-déclaré
SWE-Bench Verified93,9 %2ᵉ / 100llm-statsAuto-déclaré
CharXiv-R93,2 %1ᵉ / 42llm-statsAuto-déclaré
MMMLU92,7 %1ᵉ / 49llm-statsAuto-déclaré
FigQA89,0 %1ᵉ / 3llm-statsAuto-déclaré
SWE-bench Multilingual87,3 %1ᵉ / 32llm-statsAuto-déclaré
BrowseComp86,9 %2ᵉ / 51llm-statsAuto-déclaré
CyberGym83,1 %1ᵉ / 9llm-statsAuto-déclaré
Terminal-Bench 2.082,0 %2ᵉ / 48llm-statsAuto-déclaré
Graphwalks BFS >128k80,0 %1ᵉ / 8llm-statsAuto-déclaré
OSWorld-Verified79,6 %3ᵉ / 17llm-statsAuto-déclaré
SWE-Bench Pro77,8 %2ᵉ / 34llm-statsAuto-déclaré
Humanity's Last Exam64,7 %1ᵉ / 86llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Claude Mythos Preview bénéficie d’un positionnement clair dans l’écosystème Anthropic : il s’agit d’un LLM propriétaire, associé à un éditeur spécialisé dans les modèles de langage. La mention « Preview » apporte une information utile sur son statut, en signalant une version présentée comme préliminaire ou d’aperçu plutôt qu’un modèle documenté comme stable dans les données disponibles.

Limites et points d'attention. Les données vérifiées ne fournissent aucun benchmark, aucun tarif, aucune date de sortie, aucun détail d’entraînement et aucune indication de contexte d’usage. L’analyse de ses performances reste donc impossible à établir de manière factuelle. La licence propriétaire et l’absence d’ouverture des poids limitent aussi l’examen indépendant du modèle. La couverture repose sur une seule source concordante, ce qui invite à traiter la fiche comme une entrée encore peu documentée plutôt que comme un profil technique complet.


Sources des données : LLM-Stats (llm-stats.com).