Llama 3.1 Nemotron 70B Instruct

Llama 3.1 Nemotron 70B Instruct est un LLM d’instructions publié par NVIDIA le 1 octobre 2024, sous Llama 3.1 Community License avec des poids non ouverts. Avec ses 70 milliards de paramètres, il s’inscrit dans la famille des grands modèles généralistes de sa période.

Llama 3.1 Nemotron 70B Instruct est un LLM d’instructions publié par NVIDIA le 1 octobre 2024, sous Llama 3.1 Community License avec des poids non ouverts. Avec ses 70 milliards de paramètres, il s’inscrit dans la famille des grands modèles généralistes de sa période.

Le modèle est aujourd’hui ancien à l’échelle de l’IA. Son intérêt principal est historique et comparatif : il illustre le niveau atteint par un modèle NVIDIA de génération 2024, avec une très grande fenêtre de contexte et des connaissances arrêtées au 2023-12-01.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurNVIDIA
LicenceLlama 3.1 Community License (poids non ouverts)
Date de sortie1 octobre 2024
Connaissances jusqu'à2023-12-01
Multimodalnon
Paramètres70 milliards
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
GSM8k91,4 %22ᵉ / 47llm-statsAuto-déclaré
HellaSwag85,6 %12ᵉ / 27llm-statsAuto-déclaré
Winogrande84,5 %5ᵉ / 22llm-statsAuto-déclaré
MMLU80,2 %59ᵉ / 98llm-statsAuto-déclaré
ARC-C69,2 %23ᵉ / 34llm-statsAuto-déclaré
TruthfulQA58,6 %7ᵉ / 18llm-statsAuto-déclaré
MT-Bench9,0 %12ᵉ / 12llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Llama 3.1 Nemotron 70B Instruct se distingue surtout par sa fenêtre de contexte de 131 072 tokens, très élevée pour un modèle de cette génération, ce qui le rendait adapté à l’analyse de longs documents ou de corpus étendus dans les usages de son époque. À sa sortie, son niveau sur MMLU (évaluation de connaissances et de raisonnement général) le plaçait dans le top 49% des 41 LLM comparables publiés dans une fenêtre de plus ou moins neuf mois. Ce positionnement indique un modèle compétitif sans être dominant, davantage représentatif du milieu-haut de sa génération que d’un modèle frontière.

Limites et points d'attention. Son ancienneté pèse fortement : près de deux ans représentent un écart très long dans l’IA générative, et ses performances sont aujourd’hui largement dépassées par les modèles plus récents. Le modèle est aussi à évaluer avec prudence dans les usages nécessitant des connaissances récentes, puisque sa coupure de connaissances remonte au 2023-12-01. La licence mentionnée ne s’accompagne pas de poids ouverts, ce qui limite la transparence et la réutilisation indépendante. Comme beaucoup de modèles de cette période, il est souvent retiré ou absent des catalogues actuels de l’éditeur.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).