bytedance

Seed 2.1 Pro

Seed 2.1 Pro est un LLM propriétaire de ByteDance, sorti le 24 juin 2026. Le modèle se positionne comme une offre haut de gamme de sa génération, avec des poids non ouverts et une évaluation publique limitée mais favorable.

À sa sortie, Seed 2.1 Pro se distingue surtout par son classement sur Humanity's Last Exam, où il figure dans le haut du panier des LLM lancés sur la même période. La fiche repose sur une source de données concordante, ce qui impose une lecture prudente des éléments disponibles.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	bytedance
Licence	Proprietary (poids non ouverts)
Date de sortie	24 juin 2026
Multimodal	oui

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
CharXiv-D	95,5 %	1ᵉ / 16	llm-stats	Auto-déclaré
MathVision	94,5 %	1ᵉ / 31	llm-stats	Auto-déclaré
MathVista	90,7 %	1ᵉ / 38	llm-stats	Auto-déclaré
Video-MME	89,2 %	1ᵉ / 17	llm-stats	Auto-déclaré
GDPval	87,9 %	1ᵉ / 3	llm-stats	Auto-déclaré
Beyond AIME	87,0 %	2ᵉ / 5	llm-stats	Auto-déclaré
RealWorldQA	86,7 %	2ᵉ / 25	llm-stats	Auto-déclaré
CharXiv-R	86,4 %	5ᵉ / 42	llm-stats	Auto-déclaré
BrowseComp	86,2 %	4ᵉ / 51	llm-stats	Auto-déclaré
MCP Atlas	83,8 %	1ᵉ / 27	llm-stats	Auto-déclaré
EmbSpatialBench	83,4 %	6ᵉ / 8	llm-stats	Auto-déclaré
MMMU-Pro	82,7 %	3ᵉ / 60	llm-stats	Auto-déclaré
BLINK	81,4 %	1ᵉ / 13	llm-stats	Auto-déclaré
LongVideoBench	80,6 %	1ᵉ / 4	llm-stats	Auto-déclaré
TVBench	80,5 %	1ᵉ / 3	llm-stats	Auto-déclaré
OSWorld	78,8 %	1ᵉ / 20	llm-stats	Auto-déclaré
LVBench	78,0 %	1ᵉ / 23	llm-stats	Auto-déclaré
MotionBench	74,9 %	1ᵉ / 3	llm-stats	Auto-déclaré
SimpleVQA	74,5 %	3ᵉ / 13	llm-stats	Auto-déclaré
BabyVision	73,7 %	1ᵉ / 7	llm-stats	Auto-déclaré
DynaMath	73,1 %	6ᵉ / 7	llm-stats	Auto-déclaré
OfficeQA Pro	72,2 %	1ᵉ / 5	llm-stats	Auto-déclaré
ERQA	72,0 %	1ᵉ / 22	llm-stats	Auto-déclaré
Terminal-Bench 2.1	71,0 %	3ᵉ / 6	llm-stats	Auto-déclaré
SuperGPQA	70,8 %	4ᵉ / 34	llm-stats	Auto-déclaré
CyberGym	70,2 %	6ᵉ / 9	llm-stats	Auto-déclaré
VideoHolmes	68,2 %	1ᵉ / 3	llm-stats	Auto-déclaré
OCRBench_V2	63,2 %	3ᵉ / 7	llm-stats	Auto-déclaré
WildClawBench	61,7 %	2ᵉ / 3	llm-stats	Auto-déclaré
SciCode	59,8 %	1ᵉ / 18	llm-stats	Auto-déclaré
SWE-Bench Pro	57,5 %	13ᵉ / 34	llm-stats	Auto-déclaré
ZEROBench	56,3 %	2ᵉ / 8	llm-stats	Auto-déclaré
Humanity's Last Exam	55,7 %	6ᵉ / 86	llm-stats	Auto-déclaré
VisuLogic	54,3 %	1ᵉ / 3	llm-stats	Auto-déclaré
WorldVQA	53,0 %	2ᵉ / 4	llm-stats	Auto-déclaré
VisFactor	51,4 %	1ᵉ / 3	llm-stats	Auto-déclaré
Artifacts Bench	51,0 %	1ᵉ / 3	llm-stats	Auto-déclaré
ClawEval-MM	51,0 %	2ᵉ / 3	llm-stats	Auto-déclaré
Toolathlon	50,6 %	6ᵉ / 23	llm-stats	Auto-déclaré
Program Bench	50,3 %	3ᵉ / 4	llm-stats	Auto-déclaré
NL2Repo	47,0 %	3ᵉ / 11	llm-stats	Auto-déclaré
APEX-Agents	33,8 %	1ᵉ / 5	llm-stats	Auto-déclaré
DeepSWE	32,7 %	2ᵉ / 3	llm-stats	Auto-déclaré
MathArena Apex	31,3 %	5ᵉ / 6	llm-stats	Auto-déclaré
FrontierScience Research	28,3 %	3ᵉ / 3	llm-stats	Auto-déclaré
PostTrainBench	16,5 %	4ᵉ / 4	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Seed 2.1 Pro affiche, à sa sortie, un niveau compétitif sur Humanity's Last Exam, avec une place dans le top 6% parmi 85 LLM de sa génération. Ce résultat le situe clairement parmi les modèles les plus solides de sa période sur ce benchmark, plutôt qu’en milieu de tableau. Son positionnement propriétaire indique aussi un modèle contrôlé par ByteDance, avec une distribution centrée sur l’accès au service plutôt que sur l’ouverture des poids.

Limites et points d'attention. Les informations vérifiées disponibles restent peu nombreuses, avec une seule source de données concordante. Aucun élément fourni ne permet de qualifier précisément ses performances en code, raisonnement mathématique, usage agentique, coût d’usage ou conditions d’accès. La licence propriétaire limite aussi l’audit indépendant, la réutilisation locale et l’adaptation fine par des tiers. Seed 2.1 Pro doit donc être lu comme un LLM performant à son lancement sur Humanity's Last Exam, mais encore difficile à caractériser au-delà de ce signal public.

Sources des données : LLM-Stats (llm-stats.com).

Seed 2.1 Pro

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast