Seed 2.1 Pro
Seed 2.1 Pro est un LLM propriétaire de ByteDance, sorti le 24 juin 2026. Le modèle se positionne comme une offre haut de gamme de sa génération, avec des poids non ouverts et une évaluation publique limitée mais favorable.
Seed 2.1 Pro est un LLM propriétaire de ByteDance, sorti le 24 juin 2026. Le modèle se positionne comme une offre haut de gamme de sa génération, avec des poids non ouverts et une évaluation publique limitée mais favorable.
À sa sortie, Seed 2.1 Pro se distingue surtout par son classement sur Humanity's Last Exam, où il figure dans le haut du panier des LLM lancés sur la même période. La fiche repose sur une source de données concordante, ce qui impose une lecture prudente des éléments disponibles.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | bytedance |
| Licence | Proprietary (poids non ouverts) |
| Date de sortie | 24 juin 2026 |
| Multimodal | oui |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| CharXiv-D | 95,5 % | 1ᵉ / 16 | llm-stats | Auto-déclaré |
| MathVision | 94,5 % | 1ᵉ / 31 | llm-stats | Auto-déclaré |
| MathVista | 90,7 % | 1ᵉ / 38 | llm-stats | Auto-déclaré |
| Video-MME | 89,2 % | 1ᵉ / 17 | llm-stats | Auto-déclaré |
| GDPval | 87,9 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| Beyond AIME | 87,0 % | 2ᵉ / 5 | llm-stats | Auto-déclaré |
| RealWorldQA | 86,7 % | 2ᵉ / 25 | llm-stats | Auto-déclaré |
| CharXiv-R | 86,4 % | 5ᵉ / 42 | llm-stats | Auto-déclaré |
| BrowseComp | 86,2 % | 4ᵉ / 51 | llm-stats | Auto-déclaré |
| MCP Atlas | 83,8 % | 1ᵉ / 27 | llm-stats | Auto-déclaré |
| EmbSpatialBench | 83,4 % | 6ᵉ / 8 | llm-stats | Auto-déclaré |
| MMMU-Pro | 82,7 % | 3ᵉ / 60 | llm-stats | Auto-déclaré |
| BLINK | 81,4 % | 1ᵉ / 13 | llm-stats | Auto-déclaré |
| LongVideoBench | 80,6 % | 1ᵉ / 4 | llm-stats | Auto-déclaré |
| TVBench | 80,5 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| OSWorld | 78,8 % | 1ᵉ / 20 | llm-stats | Auto-déclaré |
| LVBench | 78,0 % | 1ᵉ / 23 | llm-stats | Auto-déclaré |
| MotionBench | 74,9 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| SimpleVQA | 74,5 % | 3ᵉ / 13 | llm-stats | Auto-déclaré |
| BabyVision | 73,7 % | 1ᵉ / 7 | llm-stats | Auto-déclaré |
| DynaMath | 73,1 % | 6ᵉ / 7 | llm-stats | Auto-déclaré |
| OfficeQA Pro | 72,2 % | 1ᵉ / 5 | llm-stats | Auto-déclaré |
| ERQA | 72,0 % | 1ᵉ / 22 | llm-stats | Auto-déclaré |
| Terminal-Bench 2.1 | 71,0 % | 3ᵉ / 6 | llm-stats | Auto-déclaré |
| SuperGPQA | 70,8 % | 4ᵉ / 34 | llm-stats | Auto-déclaré |
| CyberGym | 70,2 % | 6ᵉ / 9 | llm-stats | Auto-déclaré |
| VideoHolmes | 68,2 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| OCRBench_V2 | 63,2 % | 3ᵉ / 7 | llm-stats | Auto-déclaré |
| WildClawBench | 61,7 % | 2ᵉ / 3 | llm-stats | Auto-déclaré |
| SciCode | 59,8 % | 1ᵉ / 18 | llm-stats | Auto-déclaré |
| SWE-Bench Pro | 57,5 % | 13ᵉ / 34 | llm-stats | Auto-déclaré |
| ZEROBench | 56,3 % | 2ᵉ / 8 | llm-stats | Auto-déclaré |
| Humanity's Last Exam | 55,7 % | 6ᵉ / 86 | llm-stats | Auto-déclaré |
| VisuLogic | 54,3 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| WorldVQA | 53,0 % | 2ᵉ / 4 | llm-stats | Auto-déclaré |
| VisFactor | 51,4 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| Artifacts Bench | 51,0 % | 1ᵉ / 3 | llm-stats | Auto-déclaré |
| ClawEval-MM | 51,0 % | 2ᵉ / 3 | llm-stats | Auto-déclaré |
| Toolathlon | 50,6 % | 6ᵉ / 23 | llm-stats | Auto-déclaré |
| Program Bench | 50,3 % | 3ᵉ / 4 | llm-stats | Auto-déclaré |
| NL2Repo | 47,0 % | 3ᵉ / 11 | llm-stats | Auto-déclaré |
| APEX-Agents | 33,8 % | 1ᵉ / 5 | llm-stats | Auto-déclaré |
| DeepSWE | 32,7 % | 2ᵉ / 3 | llm-stats | Auto-déclaré |
| MathArena Apex | 31,3 % | 5ᵉ / 6 | llm-stats | Auto-déclaré |
| FrontierScience Research | 28,3 % | 3ᵉ / 3 | llm-stats | Auto-déclaré |
| PostTrainBench | 16,5 % | 4ᵉ / 4 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Seed 2.1 Pro affiche, à sa sortie, un niveau compétitif sur Humanity's Last Exam, avec une place dans le top 6% parmi 85 LLM de sa génération. Ce résultat le situe clairement parmi les modèles les plus solides de sa période sur ce benchmark, plutôt qu’en milieu de tableau. Son positionnement propriétaire indique aussi un modèle contrôlé par ByteDance, avec une distribution centrée sur l’accès au service plutôt que sur l’ouverture des poids.
Limites et points d'attention. Les informations vérifiées disponibles restent peu nombreuses, avec une seule source de données concordante. Aucun élément fourni ne permet de qualifier précisément ses performances en code, raisonnement mathématique, usage agentique, coût d’usage ou conditions d’accès. La licence propriétaire limite aussi l’audit indépendant, la réutilisation locale et l’adaptation fine par des tiers. Seed 2.1 Pro doit donc être lu comme un LLM performant à son lancement sur Humanity's Last Exam, mais encore difficile à caractériser au-delà de ce signal public.
Sources des données : LLM-Stats (llm-stats.com).