bytedance

Seed 2.0 Lite

Seed 2.0 Lite est un LLM propriétaire de ByteDance, publié le 14 février 2026, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte et un tarif très économique, 87% sous la moyenne des LLM similaires.

Le modèle se distingue surtout par un bon équilibre entre coût et performances généralistes. À sa sortie, il se situait dans le top 14% des LLM de sa génération sur GPQA, avec 4 sources de données concordantes pour étayer sa fiche.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	bytedance
Licence	Proprietary (poids non ouverts)
Date de sortie	14 février 2026
Connaissances jusqu'à	2024-01-01
Multimodal	oui
Fenêtre de contexte	262 144 tokens
Modalités (entrée → sortie)	text,image,video → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : General Knowledge (Baseline)	100,0 %	1ᵉ / 250	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	100,0 %	1ᵉ / 239	benchable	✅ Mesuré
Benchable : Email Classification (Baseline)	99,0 %	24ᵉ / 254	benchable	✅ Mesuré
Benchable : Ethics (Baseline)	98,0 %	161ᵉ / 248	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	97,0 %	6ᵉ / 217	benchable	✅ Mesuré
Benchable : Coding (Baseline)	93,5 %	56ᵉ / 248	benchable	✅ Mesuré
Benchable : Hallucinations (Baseline)	81,6 %	177ᵉ / 229	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	79,0 %	52ᵉ / 252	benchable	✅ Mesuré
PinchBench : agentique (OpenClaw, 147 tâches)	75,0 %	20ᵉ / 52	pinchbench	✅ Mesuré
AIME 2025	93,0 %	28ᵉ / 108	llm-stats	Auto-déclaré
AIME 2026	88,3 %	12ᵉ / 17	llm-stats	Auto-déclaré
GPQA	85,1 %	42ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench v6	81,7 %	16ᵉ / 53	llm-stats	Auto-déclaré
SWE-Bench Verified	73,5 %	38ᵉ / 100	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : General Knowledge (Baseline)

Claude Opus 4100 %

Gemini 2.5 Flash100 %

GPT-5100 %

qwen3-235b-a22b-04-28100 %

▶ Seed 2.0 Lite100 %

DeepSeek R1 Distill Lla…100 %

Benchable : Reasoning (Baseline)

DeepSeek V4 Flash100 %

Gemini 3.1 Pro Preview100 %

GPT-5.5100 %

qwen3-32b-04-28100 %

▶ Seed 2.0 Lite100 %

Claude Opus 4.598 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
Seed	0,25 $	2 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 87 % en dessous de la moyenne des LLM similaires, et 19,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût par exécution agentique — PinchBench (147 tâches)	4,45 $
Durée d'exécution — PinchBench	4 h 05 min
Indice valeur/coût — PinchBench	51,67
Coût moyen par benchmark — Benchable	0,11 $
Latence moyenne par benchmark — Benchable	23 min 37 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Seed 2.0 Lite ressort particulièrement bien sur Benchable en General Knowledge et en Reasoning, où il atteint le tout premier rang des modèles évalués, ainsi qu’en Mathematics, domaine où il figure dans le top 10. Ces résultats indiquent un profil solide pour les tâches de connaissances, de raisonnement structuré et de calcul. Sa fenêtre de contexte de 262 144 tokens en fait aussi un modèle adapté aux entrées longues, notamment l’analyse de documents volumineux ou de conversations étendues. Son principal avantage économique est net : son tarif d’entrée et de sortie le place dans une catégorie très abordable, avec un coût environ 19,3 fois inférieur à celui des modèles frontière.

Limites et points d'attention. Seed 2.0 Lite reste un modèle propriétaire, sans poids ouverts, ce qui limite l’audit indépendant, l’auto-hébergement et les adaptations profondes. Sa date de connaissances s’arrête au 2024-01-01, ce qui impose une vigilance pour les sujets récents. Ses résultats sont moins distinctifs en Ethics et en Coding, où il ne se place pas parmi les tout meilleurs malgré des scores élevés. Le modèle convient surtout aux usages généralistes à fort volume, quand le coût et le long contexte priment sur l’ouverture des poids ou l’excellence spécialisée en code.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · PinchBench (pinchbench.com) · Benchable.ai (benchable.ai).

Seed 2.0 Lite

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast