Nex AGI: Nex-N2-Pro
Nex AGI: Nex-N2-Pro est un LLM publié par Nex AGI le 8 juin 2026, avec 17 milliards de paramètres actifs et une fenêtre de contexte de 262 144 tokens. Son positionnement associe grand contexte, coût très bas et classements élevés sur plusieurs évaluations généralistes.
Nex AGI: Nex-N2-Pro est un LLM publié par Nex AGI le 8 juin 2026, avec 17 milliards de paramètres actifs et une fenêtre de contexte de 262 144 tokens. Son positionnement associe grand contexte, coût très bas et classements élevés sur plusieurs évaluations généralistes.
Le modèle se distingue surtout par son rapport performance-prix: ses tarifs sont annoncés 87% sous la moyenne de LLM similaires et environ 19,3 fois inférieurs à ceux des modèles frontière. Les résultats disponibles, issus de 3 sources concordantes, le placent dans le haut du tableau en connaissance générale, éthique, code et comportements agentiques.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Nex AGI |
| Date de sortie | 8 juin 2026 |
| Multimodal | oui |
| Paramètres actifs | 17 milliards |
| Fenêtre de contexte | 262 144 tokens |
| Modalités (entrée → sortie) | text,image → text |
Indices de synthèse
| Indice | Valeur | Rang (LLM) |
|---|---|---|
| Intelligence Index | 41.0 | 16ᵉ / 136 |
| Code Index | 59.1 | 14ᵉ / 50 |
| Agentic Index | 31.0 | 11ᵉ / 42 |
Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : General Knowledge (Baseline) | 100,0 % | 1ᵉ / 250 | benchable | ✅ Mesuré |
| Benchable : Ethics (Baseline) | 100,0 % | 1ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Email Classification (Baseline) | 99,0 % | 24ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : Reasoning (Baseline) | 96,0 % | 39ᵉ / 239 | benchable | ✅ Mesuré |
| Benchable : Coding (Baseline) | 93,0 % | 58ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Mathematics (Baseline) | 93,0 % | 67ᵉ / 217 | benchable | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 75,0 % | 68ᵉ / 252 | benchable | ✅ Mesuré |
| Benchable : Hallucinations (Baseline) | 68,0 % | 196ᵉ / 229 | benchable | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Intelligence Index
Code Index
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Nex AGI | 0,25 $ | 1 $ | 0,025 $ |
| artificialanalysis | 0,5 $ | 2,5 $ | 0,25 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 87 % en dessous de la moyenne des LLM similaires, et 19,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0,1 $ |
| Latence moyenne par benchmark — Benchable | 13 min 08 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. Nex AGI: Nex-N2-Pro affiche ses meilleurs résultats sur Benchable General Knowledge (Baseline) et Ethics (Baseline), où il atteint le top 10 avec des scores parfaits. Son Code Index le situe aussi parmi les modèles solides pour la programmation, tandis que l’Agentic Index le place dans une bonne position pour les tâches nécessitant planification et enchaînement d’actions. La fenêtre de contexte de 262 144 tokens constitue un atout concret pour traiter de longs documents, de grands historiques ou des bases textuelles volumineuses. Son autre force majeure est économique: avec 0,25 $ par million de tokens en entrée et 1 $ en sortie, il vise clairement les usages à fort volume.
Limites et points d'attention. Les résultats Benchable en Coding (Baseline), Mathematics (Baseline) et Reasoning (Baseline) restent élevés, mais moins dominants que ses performances en connaissance générale et en éthique. Le classement en Email Classification (Baseline), malgré un score très haut, montre aussi que certains usages pratiques ne le placent pas tout en tête du marché. Les données disponibles reposent sur 3 sources concordantes, ce qui donne une base de comparaison, mais ne décrit pas l’entraînement, l’architecture détaillée ni les conditions d’évaluation. Le modèle convient surtout aux traitements longs et économiques, aux tâches générales, au code et aux scénarios agentiques où le coût par token compte fortement.
Sources des données : OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Benchable.ai (benchable.ai).