bytedance

Seed 2.1 Turbo

Seed 2.1 Turbo est un LLM propriétaire de ByteDance, publié le 24 juin 2026. À son lancement, il se situe dans le haut du panier de sa génération sur Humanity's Last Exam, ce qui en fait un modèle à suivre parmi les sorties récentes de grands éditeurs.

Le modèle n’est pas open source, ses poids ne sont pas ouverts. La fiche disponible repose sur une seule source de données concordante, ce qui invite à lire ses performances comme un signal de positionnement plutôt que comme un portrait complet du modèle.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	bytedance
Licence	Proprietary (poids non ouverts)
Date de sortie	24 juin 2026
Multimodal	oui

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
CharXiv-D	94,6 %	2ᵉ / 16	llm-stats	Auto-déclaré
MathVision	92,7 %	3ᵉ / 31	llm-stats	Auto-déclaré
MathVista	90,5 %	2ᵉ / 38	llm-stats	Auto-déclaré
Video-MME	89,0 %	2ᵉ / 17	llm-stats	Auto-déclaré
Beyond AIME	88,0 %	1ᵉ / 5	llm-stats	Auto-déclaré
RealWorldQA	86,3 %	3ᵉ / 25	llm-stats	Auto-déclaré
BrowseComp	84,9 %	6ᵉ / 51	llm-stats	Auto-déclaré
CharXiv-R	83,6 %	9ᵉ / 42	llm-stats	Auto-déclaré
GDPval	82,7 %	2ᵉ / 3	llm-stats	Auto-déclaré
EmbSpatialBench	82,5 %	8ᵉ / 8	llm-stats	Auto-déclaré
MMMU-Pro	82,2 %	4ᵉ / 60	llm-stats	Auto-déclaré
LongVideoBench	80,6 %	1ᵉ / 4	llm-stats	Auto-déclaré
MCP Atlas	80,3 %	4ᵉ / 27	llm-stats	Auto-déclaré
BLINK	79,4 %	2ᵉ / 13	llm-stats	Auto-déclaré
TVBench	77,2 %	3ᵉ / 3	llm-stats	Auto-déclaré
LVBench	76,8 %	2ᵉ / 23	llm-stats	Auto-déclaré
OSWorld	76,4 %	2ᵉ / 20	llm-stats	Auto-déclaré
MotionBench	74,8 %	2ᵉ / 3	llm-stats	Auto-déclaré
ERQA	71,3 %	2ᵉ / 22	llm-stats	Auto-déclaré
OfficeQA Pro	71,1 %	2ᵉ / 5	llm-stats	Auto-déclaré
SimpleVQA	71,1 %	6ᵉ / 13	llm-stats	Auto-déclaré
DynaMath	68,1 %	7ᵉ / 7	llm-stats	Auto-déclaré
Terminal-Bench 2.1	67,6 %	4ᵉ / 6	llm-stats	Auto-déclaré
VideoHolmes	67,6 %	2ᵉ / 3	llm-stats	Auto-déclaré
SuperGPQA	67,4 %	6ᵉ / 34	llm-stats	Auto-déclaré
CyberGym	67,0 %	8ᵉ / 9	llm-stats	Auto-déclaré
BabyVision	62,9 %	4ᵉ / 7	llm-stats	Auto-déclaré
OCRBench_V2	62,8 %	4ᵉ / 7	llm-stats	Auto-déclaré
WildClawBench	62,8 %	1ᵉ / 3	llm-stats	Auto-déclaré
SciCode	57,8 %	3ᵉ / 18	llm-stats	Auto-déclaré
ZEROBench	57,2 %	1ᵉ / 8	llm-stats	Auto-déclaré
SWE-Bench Pro	57,0 %	15ᵉ / 34	llm-stats	Auto-déclaré
Humanity's Last Exam	54,6 %	9ᵉ / 86	llm-stats	Auto-déclaré
VisuLogic	52,9 %	2ᵉ / 3	llm-stats	Auto-déclaré
Program Bench	49,4 %	4ᵉ / 4	llm-stats	Auto-déclaré
Toolathlon	49,1 %	9ᵉ / 23	llm-stats	Auto-déclaré
WorldVQA	48,6 %	3ᵉ / 4	llm-stats	Auto-déclaré
Artifacts Bench	47,0 %	2ᵉ / 3	llm-stats	Auto-déclaré
ClawEval-MM	46,0 %	3ᵉ / 3	llm-stats	Auto-déclaré
VisFactor	43,9 %	2ᵉ / 3	llm-stats	Auto-déclaré
NL2Repo	43,7 %	4ᵉ / 11	llm-stats	Auto-déclaré
MathArena Apex	35,4 %	4ᵉ / 6	llm-stats	Auto-déclaré
FrontierScience Research	33,3 %	2ᵉ / 3	llm-stats	Auto-déclaré
APEX-Agents	29,2 %	3ᵉ / 5	llm-stats	Auto-déclaré
DeepSWE	23,0 %	3ᵉ / 3	llm-stats	Auto-déclaré
PostTrainBench	18,3 %	3ᵉ / 4	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Le principal point fort documenté de Seed 2.1 Turbo est son résultat sur Humanity's Last Exam : à sa sortie, il figure dans le top 9% des 85 LLM de sa génération, c’est-à-dire des modèles publiés dans les quelque 18 mois précédents. Ce niveau le place parmi les modèles les plus compétitifs de son époque sur ce benchmark, et non dans le milieu de tableau. Pour un LLM propriétaire récent de ByteDance, ce classement donne un signal concret de performance générale face à une cohorte contemporaine large.

Limites et points d'attention. Les poids de Seed 2.1 Turbo ne sont pas ouverts, ce qui limite l’audit indépendant, l’hébergement autonome et les usages nécessitant un contrôle direct du modèle. La couverture disponible est réduite à une seule source concordante, donc l’évaluation publique reste étroite : aucun autre benchmark, tarif, détail d’entraînement ou information opérationnelle n’est documenté ici. Son positionnement solide sur Humanity's Last Exam ne suffit donc pas à conclure sur le code, les capacités agentiques, les mathématiques avancées, la latence ou le coût d’usage.

Sources des données : LLM-Stats (llm-stats.com).

Seed 2.1 Turbo

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast