NVIDIA

Nemotron Nano 9B v2

Nemotron Nano 9B v2 est un LLM de NVIDIA sorti le 18 août 2025, publié en open-weights sous NVIDIA Open Model License Agreement avec usage commercial autorisé. Le modèle combine un format de 9 milliards de paramètres, une fenêtre de contexte de 128 000 tokens et des connaissances…

Son positionnement est celui d’un modèle très économique, avec une tarification minimale gratuite en entrée comme en sortie et 100% sous la moyenne des LLM similaires. À sa sortie, il se situait dans le top 50% de sa génération sur GPQA, d’après trois sources de données concordantes.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	NVIDIA
Licence	NVIDIA Open Model License Agreement (open-weights, usage commercial autorisé)
Date de sortie	18 août 2025
Connaissances jusqu'à	2024-09-01
Multimodal	non
Paramètres	9 milliards
Fenêtre de contexte	128 000 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Ethics (Baseline)	100,0 %	1ᵉ / 248	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	98,6 %	133ᵉ / 250	benchable	✅ Mesuré
Benchable : Hallucinations (Baseline)	98,0 %	71ᵉ / 229	benchable	✅ Mesuré
Benchable : Email Classification (Baseline)	94,1 %	216ᵉ / 254	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	89,8 %	92ᵉ / 239	benchable	✅ Mesuré
Benchable : Coding (Baseline)	83,0 %	161ᵉ / 248	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	0,0 %	229ᵉ / 252	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	0,0 %	206ᵉ / 217	benchable	✅ Mesuré
MATH-500	97,8 %	5ᵉ / 31	llm-stats	Auto-déclaré
IFEval	90,3 %	14ᵉ / 65	llm-stats	Auto-déclaré
AIME 2025	72,1 %	78ᵉ / 108	llm-stats	Auto-déclaré
LiveCodeBench	71,1 %	19ᵉ / 72	llm-stats	Auto-déclaré
GPQA	64,0 %	136ᵉ / 213	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Ethics (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

Gemini 2.5 Flash Lite P…100 %

Qwen2.5 72B Instruct100 %

▶ Nemotron Nano 9B v2100 %

Benchable : General Knowledge (Baseline)

Claude Opus 4100 %

Gemini 2.5 Flash100 %

GPT-5100 %

nemotron-nano-12b-v2-vl100 %

▶ Nemotron Nano 9B v299 %

Llama 3.3 70B Instruct98 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
NVIDIA	gratuit	gratuit	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0 $
Latence moyenne par benchmark — Benchable	52 min 16 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Nemotron Nano 9B v2 se distingue surtout par ses résultats en Ethics (Baseline), où il atteint le premier rang du classement Benchable et figure dans le top 10. Le modèle obtient aussi un niveau solide en Hallucinations (Baseline), ce qui signale une bonne tenue sur les réponses factuellement prudentes dans ce cadre de test. General Knowledge (Baseline) affiche un score élevé, même si le rang le place plutôt au milieu du tableau. Reasoning (Baseline) reste compétitif pour un modèle de 9 milliards de paramètres, et le classement GPQA le situe, à sa sortie, dans la moitié supérieure des LLM de sa période. Sa licence open-weights avec usage commercial autorisé et son coût minimal gratuit renforcent son intérêt pour des déploiements contraints par le budget.

Limites et points d'attention. Les résultats en Coding (Baseline) et Email Classification (Baseline) sont moins convaincants en classement relatif, ce qui limite son intérêt comme modèle spécialisé dans le code ou les tâches de tri d’e-mails. La coupure des connaissances au 1er septembre 2024 impose aussi une vigilance sur les sujets récents. Profil adapté aux expérimentations open-weights à très faible coût, aux longs contextes et aux cas où la licence commerciale et la sobriété budgétaire priment sur les meilleurs résultats en code.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).

Nemotron Nano 9B v2

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast