nemotron-nano-12b-v2-vl

nemotron-nano-12b-v2-vl est un LLM de NVIDIA, sorti le 28 octobre 2025, positionné sur un segment très économique. Sa tarification gratuite en entrée comme en sortie le place 100% en dessous de la moyenne des LLM similaires, un élément central de son positionnement.

nemotron-nano-12b-v2-vl est un LLM de NVIDIA, sorti le 28 octobre 2025, positionné sur un segment très économique. Sa tarification gratuite en entrée comme en sortie le place 100% en dessous de la moyenne des LLM similaires, un élément central de son positionnement.

Le modèle se distingue surtout par de très bons résultats Benchable en Ethics, General Knowledge, Email Classification et Reasoning. Les données disponibles reposent sur 2 sources concordantes, ce qui donne une base cohérente pour situer ses performances et ses limites.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurNVIDIA
Date de sortie28 octobre 2025

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Ethics (Baseline)100,0 %1ᵉ / 248benchable✅ Mesuré
Benchable : General Knowledge (Baseline)99,5 %68ᵉ / 250benchable✅ Mesuré
Benchable : Email Classification (Baseline)98,0 %90ᵉ / 254benchable✅ Mesuré
Benchable : Reasoning (Baseline)94,0 %61ᵉ / 239benchable✅ Mesuré
Benchable : Hallucinations (Baseline)80,0 %178ᵉ / 229benchable✅ Mesuré
Benchable : Coding (Baseline)65,6 %207ᵉ / 248benchable✅ Mesuré
Benchable : Mathematics (Baseline)52,6 %182ᵉ / 217benchable✅ Mesuré
Benchable : Instruction Following (Baseline)0,0 %229ᵉ / 252benchable✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Ethics (Baseline)

Qwen2.5 72B Instruct100 %
▶ nemotron-nano-12b-v2-vl100 %

Benchable : General Knowledge (Baseline)

GPT-5100 %
▶ nemotron-nano-12b-v2-vl100 %

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
NVIDIAgratuitgratuitn.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 100 % en dessous de la moyenne des LLM similaires.

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,06 $
Latence moyenne par benchmark — Benchable27 min 42 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. nemotron-nano-12b-v2-vl affiche son meilleur profil sur Ethics (Baseline), où il atteint la première place du classement Benchable et figure dans le top 10. General Knowledge (Baseline) et Reasoning (Baseline) le placent aussi dans une zone solide, avec des scores élevés et des rangs situés dans la partie haute des classements. Email Classification (Baseline) confirme une bonne tenue sur les tâches de tri et de catégorisation. L'autre point fort est économique : son coût annoncé est gratuit pour les tokens d'entrée et de sortie, avec un positionnement 100% inférieur à la moyenne des LLM similaires.

Limites et points d'attention. Les résultats sont nettement moins favorables sur Coding (Baseline), où le modèle se situe en bas de classement malgré un score encore exploitable. Hallucinations (Baseline) constitue aussi un point de vigilance, avec un rang faible par rapport aux autres modèles évalués. Le profil général suggère donc un LLM plus convaincant pour des usages de connaissances générales, de raisonnement standard, de classification d'e-mails et d'évaluation éthique que pour la génération de code ou les contextes où la fiabilité factuelle est prioritaire. Son intérêt principal tient à l'équilibre entre performances correctes sur plusieurs tâches générales et coût extrêmement bas.


Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).