Nemotron 3 Nano (30B A3B)

Nemotron 3 Nano (30B A3B) est un LLM open-weights de NVIDIA, publié le 15 décembre 2025 sous NVIDIA Open Model License Agreement, avec usage commercial autorisé. Son positionnement combine un grand contexte, une gratuité annoncée à l’entrée comme à la sortie, et un coût inférieur de 100%…

Nemotron 3 Nano (30B A3B) est un LLM open-weights de NVIDIA, publié le 15 décembre 2025 sous NVIDIA Open Model License Agreement, avec usage commercial autorisé. Son positionnement combine un grand contexte, une gratuité annoncée à l’entrée comme à la sortie, et un coût inférieur de 100% à la moyenne des LLM similaires.

Le modèle compte 32 milliards de paramètres et a été entraîné avec 4,8 × 10²³ FLOP, soit environ 133 000 heures-GPU H100, l’équivalent d’environ 62 GPU H100 mobilisés pendant trois mois. À sa sortie, il se situait dans le top 34% de sa génération sur GPQA.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurNVIDIA
LicenceNVIDIA Open Model License Agreement (open-weights, usage commercial autorisé)
Date de sortie15 décembre 2025
Connaissances jusqu'à2025-11-28
Multimodalnon
Paramètres32 milliards
Fenêtre de contexte262 144 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Ethics (Baseline)99,0 %114ᵉ / 248benchable✅ Mesuré
Benchable : General Knowledge (Baseline)95,0 %186ᵉ / 250benchable✅ Mesuré
Benchable : Coding (Baseline)94,0 %38ᵉ / 248benchable✅ Mesuré
AIME 202599,2 %9ᵉ / 108llm-statsAuto-déclaré
WMT24++86,2 %2ᵉ / 23llm-statsAuto-déclaré
MMLU-Pro78,3 %56ᵉ / 125llm-statsAuto-déclaré
GPQA75,0 %93ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench v668,3 %34ᵉ / 53llm-statsAuto-déclaré
Arena-Hard v267,7 %8ᵉ / 16llm-statsAuto-déclaré
MMLU-ProX59,5 %25ᵉ / 32llm-statsAuto-déclaré
Tau2 Retail56,9 %25ᵉ / 25llm-statsAuto-déclaré
Tau2 Airline48,0 %19ᵉ / 22llm-statsAuto-déclaré
Tau2 Telecom42,2 %32ᵉ / 34llm-statsAuto-déclaré
SWE-Bench Verified38,8 %92ᵉ / 100llm-statsAuto-déclaré
Multi-Challenge38,5 %23ᵉ / 28llm-statsAuto-déclaré
SciCode33,3 %18ᵉ / 18llm-statsAuto-déclaré
Humanity's Last Exam15,5 %64ᵉ / 86llm-statsAuto-déclaré
Terminal-Bench8,5 %24ᵉ / 25llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Ethics (Baseline)

Qwen2.5 72B Instruct100 %
▶ Nemotron 3 Nano99 %

Benchable : General Knowledge (Baseline)

GPT-5100 %
Phi 497 %
▶ Nemotron 3 Nano95 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
NVIDIAgratuitgratuitn.d.
DeepInfra0,05 $0,2 $n.d.
deepinfra0,06 $0,24 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,02 $
Latence moyenne par benchmark — Benchable9 min 13 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Entraînement & empreinte

IndicateurValeur
Compute d'entraînement4,8 × 10²³ FLOP
MatérielNVIDIA H100 SXM5 80GB
PaysUnited States of America

Notre analyse

Forces. Nemotron 3 Nano (30B A3B) ressort surtout par son équilibre entre ouverture, coût et contexte. Sa licence open-weights autorise l’usage commercial, ce qui le place dans une catégorie exploitable hors simple expérimentation. Sa fenêtre de 262 144 tokens est un atout concret pour traiter de longs documents ou conserver davantage d’historique dans une session. Côté évaluations Benchable, le modèle obtient ses meilleurs signaux en Ethics (Baseline) et General Knowledge (Baseline), avec des scores élevés, tandis que Coding (Baseline) le place nettement mieux en rang relatif que ses autres mesures. Sa gratuité annoncée et son écart de 100% sous la moyenne tarifaire des LLM similaires renforcent son positionnement très économique.

Limites et points d'attention. Les classements Benchable montrent un profil inégal : les scores bruts sont élevés, mais les rangs en Ethics et General Knowledge restent plutôt éloignés du haut de tableau. Le classement GPQA le situe dans le top 34% des LLM de sa période, ce qui indique un modèle compétitif à sa sortie, sans le placer parmi les tout premiers de sa génération. La fiche repose sur 4 sources concordantes, mais aucune donnée fournie ne décrit ses performances en conditions réelles, ses langues de prédilection ou ses limites de déploiement. Il convient surtout aux usages où le coût nul, l’ouverture des poids et le très long contexte priment sur la recherche du meilleur niveau absolu.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0 · Benchable.ai (benchable.ai).