Nex AGI: Nex-N2-Pro

Nex AGI: Nex-N2-Pro est un LLM publié par Nex AGI le 8 juin 2026, avec 17 milliards de paramètres actifs et une fenêtre de contexte de 262 144 tokens. Son positionnement associe grand contexte, coût très bas et classements élevés sur plusieurs évaluations généralistes.

Nex AGI: Nex-N2-Pro est un LLM publié par Nex AGI le 8 juin 2026, avec 17 milliards de paramètres actifs et une fenêtre de contexte de 262 144 tokens. Son positionnement associe grand contexte, coût très bas et classements élevés sur plusieurs évaluations généralistes.

Le modèle se distingue surtout par son rapport performance-prix: ses tarifs sont annoncés 87% sous la moyenne de LLM similaires et environ 19,3 fois inférieurs à ceux des modèles frontière. Les résultats disponibles, issus de 3 sources concordantes, le placent dans le haut du tableau en connaissance générale, éthique, code et comportements agentiques.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurNex AGI
Date de sortie8 juin 2026
Multimodaloui
Paramètres actifs17 milliards
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text,image → text

Indices de synthèse

IndiceValeurRang (LLM)
Intelligence Index41.016ᵉ / 136
Code Index59.114ᵉ / 50
Agentic Index31.011ᵉ / 42

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : General Knowledge (Baseline)100,0 %1ᵉ / 250benchable✅ Mesuré
Benchable : Ethics (Baseline)100,0 %1ᵉ / 248benchable✅ Mesuré
Benchable : Email Classification (Baseline)99,0 %24ᵉ / 254benchable✅ Mesuré
Benchable : Reasoning (Baseline)96,0 %39ᵉ / 239benchable✅ Mesuré
Benchable : Coding (Baseline)93,0 %58ᵉ / 248benchable✅ Mesuré
Benchable : Mathematics (Baseline)93,0 %67ᵉ / 217benchable✅ Mesuré
Benchable : Instruction Following (Baseline)75,0 %68ᵉ / 252benchable✅ Mesuré
Benchable : Hallucinations (Baseline)68,0 %196ᵉ / 229benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

▶ Nex-N2-Pro41.0
Grok Build 0.1 061639.8

Code Index

▶ Nex-N2-Pro59.1
Grok Build 0.1 061651.5

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Nex AGI0,25 $1 $0,025 $
artificialanalysis0,5 $2,5 $0,25 $

Prix en dollars US par million de tokens.

Sa tarification se situe 87 % en dessous de la moyenne des LLM similaires, et 19,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,1 $
Latence moyenne par benchmark — Benchable13 min 08 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Nex AGI: Nex-N2-Pro affiche ses meilleurs résultats sur Benchable General Knowledge (Baseline) et Ethics (Baseline), où il atteint le top 10 avec des scores parfaits. Son Code Index le situe aussi parmi les modèles solides pour la programmation, tandis que l’Agentic Index le place dans une bonne position pour les tâches nécessitant planification et enchaînement d’actions. La fenêtre de contexte de 262 144 tokens constitue un atout concret pour traiter de longs documents, de grands historiques ou des bases textuelles volumineuses. Son autre force majeure est économique: avec 0,25 $ par million de tokens en entrée et 1 $ en sortie, il vise clairement les usages à fort volume.

Limites et points d'attention. Les résultats Benchable en Coding (Baseline), Mathematics (Baseline) et Reasoning (Baseline) restent élevés, mais moins dominants que ses performances en connaissance générale et en éthique. Le classement en Email Classification (Baseline), malgré un score très haut, montre aussi que certains usages pratiques ne le placent pas tout en tête du marché. Les données disponibles reposent sur 3 sources concordantes, ce qui donne une base de comparaison, mais ne décrit pas l’entraînement, l’architecture détaillée ni les conditions d’évaluation. Le modèle convient surtout aux traitements longs et économiques, aux tâches générales, au code et aux scénarios agentiques où le coût par token compte fortement.


Sources des données : OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Benchable.ai (benchable.ai).