inclusionAI: Ling-2.6-1T

Ling-2.6-1T est le modèle généraliste en poids ouverts d'inclusionAI, le laboratoire open-source d'Ant Group (le groupe d'Alipay), publié le 23 avril 2026 sous licence MIT. C'est un Mixture-of-Experts à très grande échelle : environ 1 026 milliards de paramètres au total, 63 activés,…

Ling-2.6-1T est le modèle généraliste en poids ouverts d'inclusionAI, le laboratoire open-source d'Ant Group (le groupe d'Alipay), publié le 23 avril 2026 sous licence MIT. C'est un Mixture-of-Experts à très grande échelle : environ 1 026 milliards de paramètres au total, 63 activés, avec une attention hybride combinant MLA et attention linéaire. Il appartient à la famille « non-thinking » : il répond directement, une stratégie de suppression de redondance limitant les chaînes de pensée verbeuses.

Sa fenêtre de contexte expose 256 000 tokens, avec un support natif annoncé jusqu'à un million.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
Éditeurinclusionai
Date de sortie23 avril 2026
Multimodalnon
Paramètres1026 milliards
Paramètres actifs63 milliards
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Hallucinations (Baseline)100,0 %1ᵉ / 229benchable✅ Mesuré
Benchable : Ethics (Baseline)100,0 %1ᵉ / 248benchable✅ Mesuré
Benchable : Email Classification (Baseline)100,0 %1ᵉ / 254benchable✅ Mesuré
Benchable : Instruction Following (Baseline)100,0 %1ᵉ / 252benchable✅ Mesuré
Benchable : General Knowledge (Baseline)99,1 %112ᵉ / 250benchable✅ Mesuré
Benchable : Mathematics (Baseline)96,4 %12ᵉ / 217benchable✅ Mesuré
PinchBench : agentique (OpenClaw, 147 tâches)82,6 %9ᵉ / 52pinchbench✅ Mesuré
Benchable : Coding (Baseline)76,9 %193ᵉ / 248benchable✅ Mesuré
Benchable : Reasoning (Baseline)33,3 %207ᵉ / 239benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Hallucinations (Baseline)

Qwen2.5 72B Instruct100 %
▶ Ling-2.6-1T100 %
Nemotron Nano 9B v298 %

Benchable : Ethics (Baseline)

Qwen2.5 72B Instruct100 %
▶ Ling-2.6-1T100 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
NovitaAI0,075 $0,625 $0,015 $

Prix en dollars US par million de tokens.

Sa tarification se situe 96 % en dessous de la moyenne des LLM similaires, et 64,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût par exécution agentique — PinchBench (147 tâches)7 $
Durée d'exécution — PinchBench3 h 59 min
Indice valeur/coût — PinchBench11,81
Coût moyen par benchmark — Benchable0,01 $
Latence moyenne par benchmark — Benchable2 min 22 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Son terrain fort est le code exécutif : sur SWE-Bench Verified, il atteint le meilleur niveau open-source pour un modèle sans raisonnement explicite, proche de GPT-5.4 en mode non-thinking, avec un excellent tool-calling. La réponse directe le rend efficace en tokens, et sa licence MIT à l'échelle du trillion de paramètres est rare. Le contexte de 256K et son coût d'entrée bas complètent le tableau.

Limites et points d'attention. Étant « non-thinking », il est faible en raisonnement pur : c'est le rôle de son jumeau Ring, et les agrégateurs attribuent souvent à tort à Ling les scores de raisonnement de Ring. Sa sortie est relativement chère, il est texte seul, et ses 1 000 milliards de paramètres rendent l'hébergement très lourd. Son indice d'intelligence diverge selon les méthodologies. Il vise les agents temps réel et le code open-source.


Sources des données : OpenRouter (openrouter.ai) · PinchBench (pinchbench.com) · Benchable.ai (benchable.ai).