Llama 3.1 Nemotron 70B Instruct
Llama 3.1 Nemotron 70B Instruct est un LLM d’instructions publié par NVIDIA le 1 octobre 2024, sous Llama 3.1 Community License avec des poids non ouverts. Avec ses 70 milliards de paramètres, il s’inscrit dans la famille des grands modèles généralistes de sa période.
Llama 3.1 Nemotron 70B Instruct est un LLM d’instructions publié par NVIDIA le 1 octobre 2024, sous Llama 3.1 Community License avec des poids non ouverts. Avec ses 70 milliards de paramètres, il s’inscrit dans la famille des grands modèles généralistes de sa période.
Le modèle est aujourd’hui ancien à l’échelle de l’IA. Son intérêt principal est historique et comparatif : il illustre le niveau atteint par un modèle NVIDIA de génération 2024, avec une très grande fenêtre de contexte et des connaissances arrêtées au 2023-12-01.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | NVIDIA |
| Licence | Llama 3.1 Community License (poids non ouverts) |
| Date de sortie | 1 octobre 2024 |
| Connaissances jusqu'à | 2023-12-01 |
| Multimodal | non |
| Paramètres | 70 milliards |
| Fenêtre de contexte | 131 072 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| GSM8k | 91,4 % | 22ᵉ / 47 | llm-stats | Auto-déclaré |
| HellaSwag | 85,6 % | 12ᵉ / 27 | llm-stats | Auto-déclaré |
| Winogrande | 84,5 % | 5ᵉ / 22 | llm-stats | Auto-déclaré |
| MMLU | 80,2 % | 59ᵉ / 98 | llm-stats | Auto-déclaré |
| ARC-C | 69,2 % | 23ᵉ / 34 | llm-stats | Auto-déclaré |
| TruthfulQA | 58,6 % | 7ᵉ / 18 | llm-stats | Auto-déclaré |
| MT-Bench | 9,0 % | 12ᵉ / 12 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. Llama 3.1 Nemotron 70B Instruct se distingue surtout par sa fenêtre de contexte de 131 072 tokens, très élevée pour un modèle de cette génération, ce qui le rendait adapté à l’analyse de longs documents ou de corpus étendus dans les usages de son époque. À sa sortie, son niveau sur MMLU (évaluation de connaissances et de raisonnement général) le plaçait dans le top 49% des 41 LLM comparables publiés dans une fenêtre de plus ou moins neuf mois. Ce positionnement indique un modèle compétitif sans être dominant, davantage représentatif du milieu-haut de sa génération que d’un modèle frontière.
Limites et points d'attention. Son ancienneté pèse fortement : près de deux ans représentent un écart très long dans l’IA générative, et ses performances sont aujourd’hui largement dépassées par les modèles plus récents. Le modèle est aussi à évaluer avec prudence dans les usages nécessitant des connaissances récentes, puisque sa coupure de connaissances remonte au 2023-12-01. La licence mentionnée ne s’accompagne pas de poids ouverts, ce qui limite la transparence et la réutilisation indépendante. Comme beaucoup de modèles de cette période, il est souvent retiré ou absent des catalogues actuels de l’éditeur.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).