Seed 2.0 Lite

Seed 2.0 Lite est un LLM propriétaire de ByteDance, publié le 14 février 2026, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte et un tarif très économique, 87% sous la moyenne des LLM similaires.

Seed 2.0 Lite est un LLM propriétaire de ByteDance, publié le 14 février 2026, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte et un tarif très économique, 87% sous la moyenne des LLM similaires.

Le modèle se distingue surtout par un bon équilibre entre coût et performances généralistes. À sa sortie, il se situait dans le top 14% des LLM de sa génération sur GPQA, avec 4 sources de données concordantes pour étayer sa fiche.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
Éditeurbytedance
LicenceProprietary (poids non ouverts)
Date de sortie14 février 2026
Connaissances jusqu'à2024-01-01
Multimodaloui
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text,image,video → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : General Knowledge (Baseline)100,0 %1ᵉ / 250benchable✅ Mesuré
Benchable : Reasoning (Baseline)100,0 %1ᵉ / 239benchable✅ Mesuré
Benchable : Email Classification (Baseline)99,0 %24ᵉ / 254benchable✅ Mesuré
Benchable : Ethics (Baseline)98,0 %161ᵉ / 248benchable✅ Mesuré
Benchable : Mathematics (Baseline)97,0 %6ᵉ / 217benchable✅ Mesuré
Benchable : Coding (Baseline)93,5 %56ᵉ / 248benchable✅ Mesuré
Benchable : Hallucinations (Baseline)81,6 %177ᵉ / 229benchable✅ Mesuré
Benchable : Instruction Following (Baseline)79,0 %52ᵉ / 252benchable✅ Mesuré
PinchBench : agentique (OpenClaw, 147 tâches)75,0 %20ᵉ / 52pinchbench✅ Mesuré
AIME 202593,0 %28ᵉ / 108llm-statsAuto-déclaré
AIME 202688,3 %12ᵉ / 17llm-statsAuto-déclaré
GPQA85,1 %42ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench v681,7 %16ᵉ / 53llm-statsAuto-déclaré
SWE-Bench Verified73,5 %38ᵉ / 100llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : General Knowledge (Baseline)

GPT-5100 %
▶ Seed 2.0 Lite100 %

Benchable : Reasoning (Baseline)

GPT-5.5100 %
▶ Seed 2.0 Lite100 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Seed0,25 $2 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 87 % en dessous de la moyenne des LLM similaires, et 19,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût par exécution agentique — PinchBench (147 tâches)4,45 $
Durée d'exécution — PinchBench4 h 05 min
Indice valeur/coût — PinchBench51,67
Coût moyen par benchmark — Benchable0,11 $
Latence moyenne par benchmark — Benchable23 min 37 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Seed 2.0 Lite ressort particulièrement bien sur Benchable en General Knowledge et en Reasoning, où il atteint le tout premier rang des modèles évalués, ainsi qu’en Mathematics, domaine où il figure dans le top 10. Ces résultats indiquent un profil solide pour les tâches de connaissances, de raisonnement structuré et de calcul. Sa fenêtre de contexte de 262 144 tokens en fait aussi un modèle adapté aux entrées longues, notamment l’analyse de documents volumineux ou de conversations étendues. Son principal avantage économique est net : son tarif d’entrée et de sortie le place dans une catégorie très abordable, avec un coût environ 19,3 fois inférieur à celui des modèles frontière.

Limites et points d'attention. Seed 2.0 Lite reste un modèle propriétaire, sans poids ouverts, ce qui limite l’audit indépendant, l’auto-hébergement et les adaptations profondes. Sa date de connaissances s’arrête au 2024-01-01, ce qui impose une vigilance pour les sujets récents. Ses résultats sont moins distinctifs en Ethics et en Coding, où il ne se place pas parmi les tout meilleurs malgré des scores élevés. Le modèle convient surtout aux usages généralistes à fort volume, quand le coût et le long contexte priment sur l’ouverture des poids ou l’excellence spécialisée en code.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · PinchBench (pinchbench.com) · Benchable.ai (benchable.ai).