Nemotron Nano 9B v2

Nemotron Nano 9B v2 est un LLM de NVIDIA sorti le 18 août 2025, publié en open-weights sous NVIDIA Open Model License Agreement avec usage commercial autorisé. Le modèle combine un format de 9 milliards de paramètres, une fenêtre de contexte de 128 000 tokens et des connaissances…

Nemotron Nano 9B v2 est un LLM de NVIDIA sorti le 18 août 2025, publié en open-weights sous NVIDIA Open Model License Agreement avec usage commercial autorisé. Le modèle combine un format de 9 milliards de paramètres, une fenêtre de contexte de 128 000 tokens et des connaissances arrêtées au 1er septembre 2024.

Son positionnement est celui d’un modèle très économique, avec une tarification minimale gratuite en entrée comme en sortie et 100% sous la moyenne des LLM similaires. À sa sortie, il se situait dans le top 50% de sa génération sur GPQA, d’après trois sources de données concordantes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurNVIDIA
LicenceNVIDIA Open Model License Agreement (open-weights, usage commercial autorisé)
Date de sortie18 août 2025
Connaissances jusqu'à2024-09-01
Multimodalnon
Paramètres9 milliards
Fenêtre de contexte128 000 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Ethics (Baseline)100,0 %1ᵉ / 248benchable✅ Mesuré
Benchable : General Knowledge (Baseline)98,6 %133ᵉ / 250benchable✅ Mesuré
Benchable : Hallucinations (Baseline)98,0 %71ᵉ / 229benchable✅ Mesuré
Benchable : Email Classification (Baseline)94,1 %216ᵉ / 254benchable✅ Mesuré
Benchable : Reasoning (Baseline)89,8 %92ᵉ / 239benchable✅ Mesuré
Benchable : Coding (Baseline)83,0 %161ᵉ / 248benchable✅ Mesuré
Benchable : Instruction Following (Baseline)0,0 %229ᵉ / 252benchable✅ Mesuré
Benchable : Mathematics (Baseline)0,0 %206ᵉ / 217benchable✅ Mesuré
MATH-50097,8 %5ᵉ / 31llm-statsAuto-déclaré
IFEval90,3 %14ᵉ / 65llm-statsAuto-déclaré
AIME 202572,1 %78ᵉ / 108llm-statsAuto-déclaré
LiveCodeBench71,1 %19ᵉ / 72llm-statsAuto-déclaré
GPQA64,0 %136ᵉ / 213llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Ethics (Baseline)

Qwen2.5 72B Instruct100 %
▶ Nemotron Nano 9B v2100 %

Benchable : General Knowledge (Baseline)

GPT-5100 %
▶ Nemotron Nano 9B v299 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
NVIDIAgratuitgratuitn.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0 $
Latence moyenne par benchmark — Benchable52 min 16 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Nemotron Nano 9B v2 se distingue surtout par ses résultats en Ethics (Baseline), où il atteint le premier rang du classement Benchable et figure dans le top 10. Le modèle obtient aussi un niveau solide en Hallucinations (Baseline), ce qui signale une bonne tenue sur les réponses factuellement prudentes dans ce cadre de test. General Knowledge (Baseline) affiche un score élevé, même si le rang le place plutôt au milieu du tableau. Reasoning (Baseline) reste compétitif pour un modèle de 9 milliards de paramètres, et le classement GPQA le situe, à sa sortie, dans la moitié supérieure des LLM de sa période. Sa licence open-weights avec usage commercial autorisé et son coût minimal gratuit renforcent son intérêt pour des déploiements contraints par le budget.

Limites et points d'attention. Les résultats en Coding (Baseline) et Email Classification (Baseline) sont moins convaincants en classement relatif, ce qui limite son intérêt comme modèle spécialisé dans le code ou les tâches de tri d’e-mails. La coupure des connaissances au 1er septembre 2024 impose aussi une vigilance sur les sujets récents. Profil adapté aux expérimentations open-weights à très faible coût, aux longs contextes et aux cas où la licence commerciale et la sobriété budgétaire priment sur les meilleurs résultats en code.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).