Nemotron Nano 9B v2
Nemotron Nano 9B v2 est un LLM de NVIDIA sorti le 18 août 2025, publié en open-weights sous NVIDIA Open Model License Agreement avec usage commercial autorisé. Le modèle combine un format de 9 milliards de paramètres, une fenêtre de contexte de 128 000 tokens et des connaissances…
Nemotron Nano 9B v2 est un LLM de NVIDIA sorti le 18 août 2025, publié en open-weights sous NVIDIA Open Model License Agreement avec usage commercial autorisé. Le modèle combine un format de 9 milliards de paramètres, une fenêtre de contexte de 128 000 tokens et des connaissances arrêtées au 1er septembre 2024.
Son positionnement est celui d’un modèle très économique, avec une tarification minimale gratuite en entrée comme en sortie et 100% sous la moyenne des LLM similaires. À sa sortie, il se situait dans le top 50% de sa génération sur GPQA, d’après trois sources de données concordantes.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | NVIDIA |
| Licence | NVIDIA Open Model License Agreement (open-weights, usage commercial autorisé) |
| Date de sortie | 18 août 2025 |
| Connaissances jusqu'à | 2024-09-01 |
| Multimodal | non |
| Paramètres | 9 milliards |
| Fenêtre de contexte | 128 000 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : Ethics (Baseline) | 100,0 % | 1ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : General Knowledge (Baseline) | 98,6 % | 133ᵉ / 250 | benchable | ✅ Mesuré |
| Benchable : Hallucinations (Baseline) | 98,0 % | 71ᵉ / 229 | benchable | ✅ Mesuré |
| Benchable : Email Classification (Baseline) | 94,1 % | 216ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : Reasoning (Baseline) | 89,8 % | 92ᵉ / 239 | benchable | ✅ Mesuré |
| Benchable : Coding (Baseline) | 83,0 % | 161ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 0,0 % | 229ᵉ / 252 | benchable | ✅ Mesuré |
| Benchable : Mathematics (Baseline) | 0,0 % | 206ᵉ / 217 | benchable | ✅ Mesuré |
| MATH-500 | 97,8 % | 5ᵉ / 31 | llm-stats | Auto-déclaré |
| IFEval | 90,3 % | 14ᵉ / 65 | llm-stats | Auto-déclaré |
| AIME 2025 | 72,1 % | 78ᵉ / 108 | llm-stats | Auto-déclaré |
| LiveCodeBench | 71,1 % | 19ᵉ / 72 | llm-stats | Auto-déclaré |
| GPQA | 64,0 % | 136ᵉ / 213 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Benchable : Ethics (Baseline)
Benchable : General Knowledge (Baseline)
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| NVIDIA | gratuit | gratuit | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0 $ |
| Latence moyenne par benchmark — Benchable | 52 min 16 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. Nemotron Nano 9B v2 se distingue surtout par ses résultats en Ethics (Baseline), où il atteint le premier rang du classement Benchable et figure dans le top 10. Le modèle obtient aussi un niveau solide en Hallucinations (Baseline), ce qui signale une bonne tenue sur les réponses factuellement prudentes dans ce cadre de test. General Knowledge (Baseline) affiche un score élevé, même si le rang le place plutôt au milieu du tableau. Reasoning (Baseline) reste compétitif pour un modèle de 9 milliards de paramètres, et le classement GPQA le situe, à sa sortie, dans la moitié supérieure des LLM de sa période. Sa licence open-weights avec usage commercial autorisé et son coût minimal gratuit renforcent son intérêt pour des déploiements contraints par le budget.
Limites et points d'attention. Les résultats en Coding (Baseline) et Email Classification (Baseline) sont moins convaincants en classement relatif, ce qui limite son intérêt comme modèle spécialisé dans le code ou les tâches de tri d’e-mails. La coupure des connaissances au 1er septembre 2024 impose aussi une vigilance sur les sujets récents. Profil adapté aux expérimentations open-weights à très faible coût, aux longs contextes et aux cas où la licence commerciale et la sobriété budgétaire priment sur les meilleurs résultats en code.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).