Nemotron 3 Nano (30B A3B)
Nemotron 3 Nano (30B A3B) est un LLM open-weights de NVIDIA, publié le 15 décembre 2025 sous NVIDIA Open Model License Agreement, avec usage commercial autorisé. Son positionnement combine un grand contexte, une gratuité annoncée à l’entrée comme à la sortie, et un coût inférieur de 100%…
Nemotron 3 Nano (30B A3B) est un LLM open-weights de NVIDIA, publié le 15 décembre 2025 sous NVIDIA Open Model License Agreement, avec usage commercial autorisé. Son positionnement combine un grand contexte, une gratuité annoncée à l’entrée comme à la sortie, et un coût inférieur de 100% à la moyenne des LLM similaires.
Le modèle compte 32 milliards de paramètres et a été entraîné avec 4,8 × 10²³ FLOP, soit environ 133 000 heures-GPU H100, l’équivalent d’environ 62 GPU H100 mobilisés pendant trois mois. À sa sortie, il se situait dans le top 34% de sa génération sur GPQA.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | NVIDIA |
| Licence | NVIDIA Open Model License Agreement (open-weights, usage commercial autorisé) |
| Date de sortie | 15 décembre 2025 |
| Connaissances jusqu'à | 2025-11-28 |
| Multimodal | non |
| Paramètres | 32 milliards |
| Fenêtre de contexte | 262 144 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : Ethics (Baseline) | 99,0 % | 114ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : General Knowledge (Baseline) | 95,0 % | 186ᵉ / 250 | benchable | ✅ Mesuré |
| Benchable : Coding (Baseline) | 94,0 % | 38ᵉ / 248 | benchable | ✅ Mesuré |
| AIME 2025 | 99,2 % | 9ᵉ / 108 | llm-stats | Auto-déclaré |
| WMT24++ | 86,2 % | 2ᵉ / 23 | llm-stats | Auto-déclaré |
| MMLU-Pro | 78,3 % | 56ᵉ / 125 | llm-stats | Auto-déclaré |
| GPQA | 75,0 % | 93ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench v6 | 68,3 % | 34ᵉ / 53 | llm-stats | Auto-déclaré |
| Arena-Hard v2 | 67,7 % | 8ᵉ / 16 | llm-stats | Auto-déclaré |
| MMLU-ProX | 59,5 % | 25ᵉ / 32 | llm-stats | Auto-déclaré |
| Tau2 Retail | 56,9 % | 25ᵉ / 25 | llm-stats | Auto-déclaré |
| Tau2 Airline | 48,0 % | 19ᵉ / 22 | llm-stats | Auto-déclaré |
| Tau2 Telecom | 42,2 % | 32ᵉ / 34 | llm-stats | Auto-déclaré |
| SWE-Bench Verified | 38,8 % | 92ᵉ / 100 | llm-stats | Auto-déclaré |
| Multi-Challenge | 38,5 % | 23ᵉ / 28 | llm-stats | Auto-déclaré |
| SciCode | 33,3 % | 18ᵉ / 18 | llm-stats | Auto-déclaré |
| Humanity's Last Exam | 15,5 % | 64ᵉ / 86 | llm-stats | Auto-déclaré |
| Terminal-Bench | 8,5 % | 24ᵉ / 25 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Benchable : Ethics (Baseline)
Benchable : General Knowledge (Baseline)
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| NVIDIA | gratuit | gratuit | n.d. |
| DeepInfra | 0,05 $ | 0,2 $ | n.d. |
| deepinfra | 0,06 $ | 0,24 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0,02 $ |
| Latence moyenne par benchmark — Benchable | 9 min 13 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Entraînement & empreinte
| Indicateur | Valeur |
|---|---|
| Compute d'entraînement | 4,8 × 10²³ FLOP |
| Matériel | NVIDIA H100 SXM5 80GB |
| Pays | United States of America |
Notre analyse
Forces. Nemotron 3 Nano (30B A3B) ressort surtout par son équilibre entre ouverture, coût et contexte. Sa licence open-weights autorise l’usage commercial, ce qui le place dans une catégorie exploitable hors simple expérimentation. Sa fenêtre de 262 144 tokens est un atout concret pour traiter de longs documents ou conserver davantage d’historique dans une session. Côté évaluations Benchable, le modèle obtient ses meilleurs signaux en Ethics (Baseline) et General Knowledge (Baseline), avec des scores élevés, tandis que Coding (Baseline) le place nettement mieux en rang relatif que ses autres mesures. Sa gratuité annoncée et son écart de 100% sous la moyenne tarifaire des LLM similaires renforcent son positionnement très économique.
Limites et points d'attention. Les classements Benchable montrent un profil inégal : les scores bruts sont élevés, mais les rangs en Ethics et General Knowledge restent plutôt éloignés du haut de tableau. Le classement GPQA le situe dans le top 34% des LLM de sa période, ce qui indique un modèle compétitif à sa sortie, sans le placer parmi les tout premiers de sa génération. La fiche repose sur 4 sources concordantes, mais aucune donnée fournie ne décrit ses performances en conditions réelles, ses langues de prédilection ou ses limites de déploiement. Il convient surtout aux usages où le coût nul, l’ouverture des poids et le très long contexte priment sur la recherche du meilleur niveau absolu.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0 · Benchable.ai (benchable.ai).