NVIDIA

nemotron-nano-12b-v2-vl

nemotron-nano-12b-v2-vl est un LLM de NVIDIA, sorti le 28 octobre 2025, positionné sur un segment très économique. Sa tarification gratuite en entrée comme en sortie le place 100% en dessous de la moyenne des LLM similaires, un élément central de son positionnement.

Le modèle se distingue surtout par de très bons résultats Benchable en Ethics, General Knowledge, Email Classification et Reasoning. Les données disponibles reposent sur 2 sources concordantes, ce qui donne une base cohérente pour situer ses performances et ses limites.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	NVIDIA
Date de sortie	28 octobre 2025

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Ethics (Baseline)	100,0 %	1ᵉ / 248	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	99,5 %	68ᵉ / 250	benchable	✅ Mesuré
Benchable : Email Classification (Baseline)	98,0 %	90ᵉ / 254	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	94,0 %	61ᵉ / 239	benchable	✅ Mesuré
Benchable : Hallucinations (Baseline)	80,0 %	178ᵉ / 229	benchable	✅ Mesuré
Benchable : Coding (Baseline)	65,6 %	207ᵉ / 248	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	52,6 %	182ᵉ / 217	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	0,0 %	229ᵉ / 252	benchable	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Ethics (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

Gemini 2.5 Flash Lite P…100 %

Qwen2.5 72B Instruct100 %

▶ nemotron-nano-12b-v2-vl100 %

Benchable : General Knowledge (Baseline)

Claude Opus 4100 %

Gemini 2.5 Flash100 %

GPT-5100 %

DeepSeek R1 Distill Lla…100 %

▶ nemotron-nano-12b-v2-vl100 %

Llama 3.3 70B Instruct98 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
NVIDIA	gratuit	gratuit	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,06 $
Latence moyenne par benchmark — Benchable	27 min 42 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. nemotron-nano-12b-v2-vl affiche son meilleur profil sur Ethics (Baseline), où il atteint la première place du classement Benchable et figure dans le top 10. General Knowledge (Baseline) et Reasoning (Baseline) le placent aussi dans une zone solide, avec des scores élevés et des rangs situés dans la partie haute des classements. Email Classification (Baseline) confirme une bonne tenue sur les tâches de tri et de catégorisation. L'autre point fort est économique : son coût annoncé est gratuit pour les tokens d'entrée et de sortie, avec un positionnement 100% inférieur à la moyenne des LLM similaires.

Limites et points d'attention. Les résultats sont nettement moins favorables sur Coding (Baseline), où le modèle se situe en bas de classement malgré un score encore exploitable. Hallucinations (Baseline) constitue aussi un point de vigilance, avec un rang faible par rapport aux autres modèles évalués. Le profil général suggère donc un LLM plus convaincant pour des usages de connaissances générales, de raisonnement standard, de classification d'e-mails et d'évaluation éthique que pour la génération de code ou les contextes où la fiabilité factuelle est prioritaire. Son intérêt principal tient à l'équilibre entre performances correctes sur plusieurs tâches générales et coût extrêmement bas.

Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).

nemotron-nano-12b-v2-vl

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast