Llama 3.2 90B Instruct

Llama 3.2 90B Instruct est un modèle de langage de Meta publié le 25 septembre 2024, dans la famille Llama 3.2, avec des poids ouverts et une licence autorisant l’usage commercial. Son format Instruct le positionne comme une version destinée aux échanges guidés par consignes.

Llama 3.2 90B Instruct est un modèle de langage de Meta publié le 25 septembre 2024, dans la famille Llama 3.2, avec des poids ouverts et une licence autorisant l’usage commercial. Son format Instruct le positionne comme une version destinée aux échanges guidés par consignes.

Avec environ deux ans d’ancienneté, il appartient déjà à une génération très éloignée du rythme actuel de l’IA. Sa fiche reste utile pour comprendre ce que proposait un grand modèle open-weights de Meta à sa sortie, notamment avec une fenêtre de contexte très étendue et un socle de 90 milliards de paramètres.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMeta
LicenceLlama 3.2 (open-weights, usage commercial autorisé)
Date de sortie25 septembre 2024
Connaissances jusqu'à2023-12-31
Multimodaloui
Paramètres90 milliards
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
AI2D92,3 %10ᵉ / 32llm-statsAuto-déclaré
DocVQA90,1 %19ᵉ / 26llm-statsAuto-déclaré
MGSM86,9 %13ᵉ / 30llm-statsAuto-déclaré
MMLU86,0 %31ᵉ / 98llm-statsAuto-déclaré
ChartQA85,5 %13ᵉ / 24llm-statsAuto-déclaré
VQAv278,1 %3ᵉ / 3llm-statsAuto-déclaré
TextVQA73,5 %11ᵉ / 15llm-statsAuto-déclaré
MATH68,0 %43ᵉ / 70llm-statsAuto-déclaré
MMMU60,3 %42ᵉ / 61llm-statsAuto-déclaré
MathVista57,3 %28ᵉ / 38llm-statsAuto-déclaré
GPQA46,7 %166ᵉ / 213llm-statsAuto-déclaré
MMMU-Pro45,2 %55ᵉ / 60llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Llama 3.2 90B Instruct se situait dans la moitié haute des LLM de sa génération sur GPQA, sans être un modèle de tête. Ce positionnement indique un niveau compétitif pour son époque sur un benchmark exigeant, avec une place plus solide que de nombreux modèles contemporains. Sa fenêtre de contexte de 131 072 tokens constituait aussi un atout concret pour traiter de longs documents ou conserver davantage d’informations dans une même interaction. Le modèle se distingue également par son statut open-weights avec usage commercial autorisé, un point important dans l’écosystème Meta, car il ouvrait la voie à des déploiements et adaptations hors d’une API propriétaire.

Limites et points d’attention. Llama 3.2 90B Instruct est aujourd’hui un modèle ancien à l’échelle de l’IA générative. Ses performances doivent être lues par rapport aux modèles de sa période, car elles sont probablement largement dépassées par les modèles haut de gamme récents. Sa connaissance s’arrête au 31 décembre 2023, ce qui limite sa pertinence sur les faits, produits, normes et événements ultérieurs. Son classement GPQA, top 44% parmi 34 LLM comparables sur la période, montre un modèle honorable mais pas dominant dès son lancement. Le modèle est aussi susceptible de ne plus être proposé activement dans les catalogues récents de l’éditeur, ce qui réduit son intérêt pratique pour de nouveaux projets.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).