Seed 2.1 Pro

Seed 2.1 Pro est un LLM propriétaire de ByteDance, sorti le 24 juin 2026. Le modèle se positionne comme une offre haut de gamme de sa génération, avec des poids non ouverts et une évaluation publique limitée mais favorable.

Seed 2.1 Pro est un LLM propriétaire de ByteDance, sorti le 24 juin 2026. Le modèle se positionne comme une offre haut de gamme de sa génération, avec des poids non ouverts et une évaluation publique limitée mais favorable.

À sa sortie, Seed 2.1 Pro se distingue surtout par son classement sur Humanity's Last Exam, où il figure dans le haut du panier des LLM lancés sur la même période. La fiche repose sur une source de données concordante, ce qui impose une lecture prudente des éléments disponibles.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
Éditeurbytedance
LicenceProprietary (poids non ouverts)
Date de sortie24 juin 2026
Multimodaloui

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
CharXiv-D95,5 %1ᵉ / 16llm-statsAuto-déclaré
MathVision94,5 %1ᵉ / 31llm-statsAuto-déclaré
MathVista90,7 %1ᵉ / 38llm-statsAuto-déclaré
Video-MME89,2 %1ᵉ / 17llm-statsAuto-déclaré
GDPval87,9 %1ᵉ / 3llm-statsAuto-déclaré
Beyond AIME87,0 %2ᵉ / 5llm-statsAuto-déclaré
RealWorldQA86,7 %2ᵉ / 25llm-statsAuto-déclaré
CharXiv-R86,4 %5ᵉ / 42llm-statsAuto-déclaré
BrowseComp86,2 %4ᵉ / 51llm-statsAuto-déclaré
MCP Atlas83,8 %1ᵉ / 27llm-statsAuto-déclaré
EmbSpatialBench83,4 %6ᵉ / 8llm-statsAuto-déclaré
MMMU-Pro82,7 %3ᵉ / 60llm-statsAuto-déclaré
BLINK81,4 %1ᵉ / 13llm-statsAuto-déclaré
LongVideoBench80,6 %1ᵉ / 4llm-statsAuto-déclaré
TVBench80,5 %1ᵉ / 3llm-statsAuto-déclaré
OSWorld78,8 %1ᵉ / 20llm-statsAuto-déclaré
LVBench78,0 %1ᵉ / 23llm-statsAuto-déclaré
MotionBench74,9 %1ᵉ / 3llm-statsAuto-déclaré
SimpleVQA74,5 %3ᵉ / 13llm-statsAuto-déclaré
BabyVision73,7 %1ᵉ / 7llm-statsAuto-déclaré
DynaMath73,1 %6ᵉ / 7llm-statsAuto-déclaré
OfficeQA Pro72,2 %1ᵉ / 5llm-statsAuto-déclaré
ERQA72,0 %1ᵉ / 22llm-statsAuto-déclaré
Terminal-Bench 2.171,0 %3ᵉ / 6llm-statsAuto-déclaré
SuperGPQA70,8 %4ᵉ / 34llm-statsAuto-déclaré
CyberGym70,2 %6ᵉ / 9llm-statsAuto-déclaré
VideoHolmes68,2 %1ᵉ / 3llm-statsAuto-déclaré
OCRBench_V263,2 %3ᵉ / 7llm-statsAuto-déclaré
WildClawBench61,7 %2ᵉ / 3llm-statsAuto-déclaré
SciCode59,8 %1ᵉ / 18llm-statsAuto-déclaré
SWE-Bench Pro57,5 %13ᵉ / 34llm-statsAuto-déclaré
ZEROBench56,3 %2ᵉ / 8llm-statsAuto-déclaré
Humanity's Last Exam55,7 %6ᵉ / 86llm-statsAuto-déclaré
VisuLogic54,3 %1ᵉ / 3llm-statsAuto-déclaré
WorldVQA53,0 %2ᵉ / 4llm-statsAuto-déclaré
VisFactor51,4 %1ᵉ / 3llm-statsAuto-déclaré
Artifacts Bench51,0 %1ᵉ / 3llm-statsAuto-déclaré
ClawEval-MM51,0 %2ᵉ / 3llm-statsAuto-déclaré
Toolathlon50,6 %6ᵉ / 23llm-statsAuto-déclaré
Program Bench50,3 %3ᵉ / 4llm-statsAuto-déclaré
NL2Repo47,0 %3ᵉ / 11llm-statsAuto-déclaré
APEX-Agents33,8 %1ᵉ / 5llm-statsAuto-déclaré
DeepSWE32,7 %2ᵉ / 3llm-statsAuto-déclaré
MathArena Apex31,3 %5ᵉ / 6llm-statsAuto-déclaré
FrontierScience Research28,3 %3ᵉ / 3llm-statsAuto-déclaré
PostTrainBench16,5 %4ᵉ / 4llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Seed 2.1 Pro affiche, à sa sortie, un niveau compétitif sur Humanity's Last Exam, avec une place dans le top 6% parmi 85 LLM de sa génération. Ce résultat le situe clairement parmi les modèles les plus solides de sa période sur ce benchmark, plutôt qu’en milieu de tableau. Son positionnement propriétaire indique aussi un modèle contrôlé par ByteDance, avec une distribution centrée sur l’accès au service plutôt que sur l’ouverture des poids.

Limites et points d'attention. Les informations vérifiées disponibles restent peu nombreuses, avec une seule source de données concordante. Aucun élément fourni ne permet de qualifier précisément ses performances en code, raisonnement mathématique, usage agentique, coût d’usage ou conditions d’accès. La licence propriétaire limite aussi l’audit indépendant, la réutilisation locale et l’adaptation fine par des tiers. Seed 2.1 Pro doit donc être lu comme un LLM performant à son lancement sur Humanity's Last Exam, mais encore difficile à caractériser au-delà de ce signal public.


Sources des données : LLM-Stats (llm-stats.com).