NVIDIA

Nemotron 3 Nano (30B A3B)

Nemotron 3 Nano (30B A3B) est un LLM open-weights de NVIDIA, publié le 15 décembre 2025 sous NVIDIA Open Model License Agreement, avec usage commercial autorisé. Son positionnement combine un grand contexte, une gratuité annoncée à l’entrée comme à la sortie, et un coût inférieur de 100%…

Le modèle compte 32 milliards de paramètres et a été entraîné avec 4,8 × 10²³ FLOP, soit environ 133 000 heures-GPU H100, l’équivalent d’environ 62 GPU H100 mobilisés pendant trois mois. À sa sortie, il se situait dans le top 34% de sa génération sur GPQA.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	NVIDIA
Licence	NVIDIA Open Model License Agreement (open-weights, usage commercial autorisé)
Date de sortie	15 décembre 2025
Connaissances jusqu'à	2025-11-28
Multimodal	non
Paramètres	32 milliards
Fenêtre de contexte	262 144 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Ethics (Baseline)	99,0 %	114ᵉ / 248	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	95,0 %	186ᵉ / 250	benchable	✅ Mesuré
Benchable : Coding (Baseline)	94,0 %	38ᵉ / 248	benchable	✅ Mesuré
AIME 2025	99,2 %	9ᵉ / 108	llm-stats	Auto-déclaré
WMT24++	86,2 %	2ᵉ / 23	llm-stats	Auto-déclaré
MMLU-Pro	78,3 %	56ᵉ / 125	llm-stats	Auto-déclaré
GPQA	75,0 %	93ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench v6	68,3 %	34ᵉ / 53	llm-stats	Auto-déclaré
Arena-Hard v2	67,7 %	8ᵉ / 16	llm-stats	Auto-déclaré
MMLU-ProX	59,5 %	25ᵉ / 32	llm-stats	Auto-déclaré
Tau2 Retail	56,9 %	25ᵉ / 25	llm-stats	Auto-déclaré
Tau2 Airline	48,0 %	19ᵉ / 22	llm-stats	Auto-déclaré
Tau2 Telecom	42,2 %	32ᵉ / 34	llm-stats	Auto-déclaré
SWE-Bench Verified	38,8 %	92ᵉ / 100	llm-stats	Auto-déclaré
Multi-Challenge	38,5 %	23ᵉ / 28	llm-stats	Auto-déclaré
SciCode	33,3 %	18ᵉ / 18	llm-stats	Auto-déclaré
Humanity's Last Exam	15,5 %	64ᵉ / 86	llm-stats	Auto-déclaré
Terminal-Bench	8,5 %	24ᵉ / 25	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Ethics (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

Gemini 2.5 Flash Lite P…100 %

Qwen2.5 72B Instruct100 %

▶ Nemotron 3 Nano99 %

Benchable : General Knowledge (Baseline)

Claude Opus 4100 %

Gemini 2.5 Flash100 %

GPT-5100 %

Phi 497 %

▶ Nemotron 3 Nano95 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
NVIDIA	gratuit	gratuit	n.d.
DeepInfra	0,05 $	0,2 $	n.d.
deepinfra	0,06 $	0,24 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,02 $
Latence moyenne par benchmark — Benchable	9 min 13 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Entraînement & empreinte

Indicateur	Valeur
Compute d'entraînement	4,8 × 10²³ FLOP
Matériel	NVIDIA H100 SXM5 80GB
Pays	United States of America

Notre analyse

Forces. Nemotron 3 Nano (30B A3B) ressort surtout par son équilibre entre ouverture, coût et contexte. Sa licence open-weights autorise l’usage commercial, ce qui le place dans une catégorie exploitable hors simple expérimentation. Sa fenêtre de 262 144 tokens est un atout concret pour traiter de longs documents ou conserver davantage d’historique dans une session. Côté évaluations Benchable, le modèle obtient ses meilleurs signaux en Ethics (Baseline) et General Knowledge (Baseline), avec des scores élevés, tandis que Coding (Baseline) le place nettement mieux en rang relatif que ses autres mesures. Sa gratuité annoncée et son écart de 100% sous la moyenne tarifaire des LLM similaires renforcent son positionnement très économique.

Limites et points d'attention. Les classements Benchable montrent un profil inégal : les scores bruts sont élevés, mais les rangs en Ethics et General Knowledge restent plutôt éloignés du haut de tableau. Le classement GPQA le situe dans le top 34% des LLM de sa période, ce qui indique un modèle compétitif à sa sortie, sans le placer parmi les tout premiers de sa génération. La fiche repose sur 4 sources concordantes, mais aucune donnée fournie ne décrit ses performances en conditions réelles, ses langues de prédilection ou ses limites de déploiement. Il convient surtout aux usages où le coût nul, l’ouverture des poids et le très long contexte priment sur la recherche du meilleur niveau absolu.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0 · Benchable.ai (benchable.ai).

Nemotron 3 Nano (30B A3B)

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Entraînement & empreinte

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast