Claude Mythos Preview
Claude Mythos Preview est un LLM propriétaire d’Anthropic, présenté sous une appellation « Preview » qui le situe comme une version non qualifiée ici de modèle final.
Claude Mythos Preview est un LLM propriétaire d’Anthropic, présenté sous une appellation « Preview » qui le situe comme une version non qualifiée ici de modèle final.
La fiche disponible repose sur une seule source de données concordante. Les poids ne sont pas ouverts, ce qui place Claude Mythos Preview dans la catégorie des modèles fermés, avec une évaluation dépendante des informations publiquement disponibles.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Anthropic |
| Licence | Proprietary (poids non ouverts) |
| Multimodal | oui |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| USAMO25 | 97,6 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| GPQA | 94,6 % | 1ᵉ / 213 | llm-stats | Auto-déclaré |
| SWE-Bench Verified | 93,9 % | 2ᵉ / 100 | llm-stats | Auto-déclaré |
| CharXiv-R | 93,2 % | 1ᵉ / 42 | llm-stats | Auto-déclaré |
| MMMLU | 92,7 % | 1ᵉ / 49 | llm-stats | Auto-déclaré |
| FigQA | 89,0 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| SWE-bench Multilingual | 87,3 % | 1ᵉ / 32 | llm-stats | Auto-déclaré |
| BrowseComp | 86,9 % | 2ᵉ / 51 | llm-stats | Auto-déclaré |
| CyberGym | 83,1 % | 1ᵉ / 9 | llm-stats | Auto-déclaré |
| Terminal-Bench 2.0 | 82,0 % | 2ᵉ / 48 | llm-stats | Auto-déclaré |
| Graphwalks BFS >128k | 80,0 % | 1ᵉ / 8 | llm-stats | Auto-déclaré |
| OSWorld-Verified | 79,6 % | 3ᵉ / 17 | llm-stats | Auto-déclaré |
| SWE-Bench Pro | 77,8 % | 2ᵉ / 34 | llm-stats | Auto-déclaré |
| Humanity's Last Exam | 64,7 % | 1ᵉ / 86 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Claude Mythos Preview bénéficie d’un positionnement clair dans l’écosystème Anthropic : il s’agit d’un LLM propriétaire, associé à un éditeur spécialisé dans les modèles de langage. La mention « Preview » apporte une information utile sur son statut, en signalant une version présentée comme préliminaire ou d’aperçu plutôt qu’un modèle documenté comme stable dans les données disponibles.
Limites et points d'attention. Les données vérifiées ne fournissent aucun benchmark, aucun tarif, aucune date de sortie, aucun détail d’entraînement et aucune indication de contexte d’usage. L’analyse de ses performances reste donc impossible à établir de manière factuelle. La licence propriétaire et l’absence d’ouverture des poids limitent aussi l’examen indépendant du modèle. La couverture repose sur une seule source concordante, ce qui invite à traiter la fiche comme une entrée encore peu documentée plutôt que comme un profil technique complet.
Sources des données : LLM-Stats (llm-stats.com).