Llama 3.1 Nemotron Nano 8B V1

Llama 3.1 Nemotron Nano 8B V1 est un LLM de NVIDIA publié le 18 mars 2025 sous Llama 3.1 Community License, avec des poids non ouverts. Son format 8 milliards de paramètres le place dans la catégorie des modèles compacts, tandis que sa fenêtre de contexte de 131 072 tokens constitue son…

Llama 3.1 Nemotron Nano 8B V1 est un LLM de NVIDIA publié le 18 mars 2025 sous Llama 3.1 Community License, avec des poids non ouverts. Son format 8 milliards de paramètres le place dans la catégorie des modèles compacts, tandis que sa fenêtre de contexte de 131 072 tokens constitue son trait technique le plus distinctif.

Avec environ un an d’ancienneté, ce modèle appartient déjà à une génération ancienne à l’échelle de l’IA. À sa sortie, il se situait dans le top 42% sur GPQA parmi 80 LLM de sa période, ce qui en fait un modèle alors compétitif, mais à replacer face aux standards de 2025.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurNVIDIA
LicenceLlama 3.1 Community License (poids non ouverts)
Date de sortie18 mars 2025
Connaissances jusqu'à2023-12-31
Multimodalnon
Paramètres8 milliards
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MATH-50095,4 %17ᵉ / 31llm-statsAuto-déclaré
MBPP84,6 %6ᵉ / 33llm-statsAuto-déclaré
MT-Bench81,0 %10ᵉ / 12llm-statsAuto-déclaré
IFEval79,3 %54ᵉ / 65llm-statsAuto-déclaré
BFCL v263,6 %5ᵉ / 5llm-statsAuto-déclaré
GPQA54,1 %148ᵉ / 213llm-statsAuto-déclaré
AIME 202547,1 %98ᵉ / 108llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Llama 3.1 Nemotron Nano 8B V1 combine une taille modérée, 8 milliards de paramètres, avec une très grande fenêtre de contexte de 131 072 tokens. Cette association le rendait notable à sa sortie, car elle rapprochait un modèle compact de scénarios nécessitant de longs volumes de texte en entrée. Sur GPQA, il figurait dans le top 42% des LLM de sa génération, parmi 80 modèles comparables sur une période de plus ou moins neuf mois. La fiche repose aussi sur 2 sources de données concordantes, ce qui renforce la fiabilité des éléments disponibles.

Limites et points d'attention. Son ancienneté d’environ un an est importante dans un secteur où les performances progressent rapidement. Ses résultats doivent donc être lus comme ceux d’un modèle de sa période, probablement dépassé par les modèles actuels et souvent absent des catalogues récents de l’éditeur. Ses connaissances s’arrêtent au 31 décembre 2023, ce qui limite la couverture des événements, logiciels et pratiques apparus ensuite. La licence Llama 3.1 Community License avec poids non ouverts réduit aussi la marge de modification et d’audit par rapport à des modèles réellement ouverts.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).