NVIDIA

Llama 3.1 Nemotron 70B Instruct

Llama 3.1 Nemotron 70B Instruct est un LLM d’instructions publié par NVIDIA le 1 octobre 2024, sous Llama 3.1 Community License avec des poids non ouverts. Avec ses 70 milliards de paramètres, il s’inscrit dans la famille des grands modèles généralistes de sa période.

Le modèle est aujourd’hui ancien à l’échelle de l’IA. Son intérêt principal est historique et comparatif : il illustre le niveau atteint par un modèle NVIDIA de génération 2024, avec une très grande fenêtre de contexte et des connaissances arrêtées au 2023-12-01.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	NVIDIA
Licence	Llama 3.1 Community License (poids non ouverts)
Date de sortie	1 octobre 2024
Connaissances jusqu'à	2023-12-01
Multimodal	non
Paramètres	70 milliards
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
GSM8k	91,4 %	22ᵉ / 47	llm-stats	Auto-déclaré
HellaSwag	85,6 %	12ᵉ / 27	llm-stats	Auto-déclaré
Winogrande	84,5 %	5ᵉ / 22	llm-stats	Auto-déclaré
MMLU	80,2 %	59ᵉ / 98	llm-stats	Auto-déclaré
ARC-C	69,2 %	23ᵉ / 34	llm-stats	Auto-déclaré
TruthfulQA	58,6 %	7ᵉ / 18	llm-stats	Auto-déclaré
MT-Bench	9,0 %	12ᵉ / 12	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Llama 3.1 Nemotron 70B Instruct se distingue surtout par sa fenêtre de contexte de 131 072 tokens, très élevée pour un modèle de cette génération, ce qui le rendait adapté à l’analyse de longs documents ou de corpus étendus dans les usages de son époque. À sa sortie, son niveau sur MMLU (évaluation de connaissances et de raisonnement général) le plaçait dans le top 49% des 41 LLM comparables publiés dans une fenêtre de plus ou moins neuf mois. Ce positionnement indique un modèle compétitif sans être dominant, davantage représentatif du milieu-haut de sa génération que d’un modèle frontière.

Limites et points d'attention. Son ancienneté pèse fortement : près de deux ans représentent un écart très long dans l’IA générative, et ses performances sont aujourd’hui largement dépassées par les modèles plus récents. Le modèle est aussi à évaluer avec prudence dans les usages nécessitant des connaissances récentes, puisque sa coupure de connaissances remonte au 2023-12-01. La licence mentionnée ne s’accompagne pas de poids ouverts, ce qui limite la transparence et la réutilisation indépendante. Comme beaucoup de modèles de cette période, il est souvent retiré ou absent des catalogues actuels de l’éditeur.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

Llama 3.1 Nemotron 70B Instruct

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast