Llama 4 Maverick

Llama 4 Maverick est un LLM de Meta sorti le 5 avril 2025 sous Llama 4 Community License Agreement, avec des poids non ouverts. À l’échelle de l’IA, son ancienneté d’environ un an le place déjà dans une génération probablement dépassée, à comparer surtout aux modèles de sa période plutôt…

Llama 4 Maverick est un LLM de Meta sorti le 5 avril 2025 sous Llama 4 Community License Agreement, avec des poids non ouverts. À l’échelle de l’IA, son ancienneté d’environ un an le place déjà dans une génération probablement dépassée, à comparer surtout aux modèles de sa période plutôt qu’aux systèmes actuels.

Le modèle se distingue par une très grande fenêtre de contexte, proche de 1,0 M de tokens, et par une architecture de 400 milliards de paramètres dont 17 milliards actifs. Son entraînement reste notable par son ampleur, avec 2,2 × 10²⁴ FLOP, soit environ 623 000 heures-GPU H100.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMeta
LicenceLlama 4 Community License Agreement (poids non ouverts)
Date de sortie5 avril 2025
Connaissances jusqu'à2024-08-31
Multimodaloui
Paramètres400 milliards
Paramètres actifs17 milliards
Fenêtre de contexte1 048 576 tokens (≈ 1,0 M)
Modalités (entrée → sortie)text,image → text

Indices de synthèse

IndiceValeurRang (LLM)
Intelligence Index14.3115ᵉ / 136
Code Index16.348ᵉ / 50
Agentic Index1.342ᵉ / 42
Math Index19.347ᵉ / 55

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: MATH level 573,0 %30ᵉ / 84epoch✅ Mesuré
Epoch: GPQA diamond67,0 %61ᵉ / 132epoch✅ Mesuré
Epoch: OTIS Mock AIME 2024-202520,6 %72ᵉ / 111epoch✅ Mesuré
Epoch: FrontierMath-2025-02-28-Private0,7 %62ᵉ / 69epoch✅ Mesuré
Epoch: FrontierMath-2025-02-28-Public0,0 %35ᵉ / 64epoch✅ Mesuré
DocVQA94,4 %7ᵉ / 26llm-statsAuto-déclaré
MGSM92,3 %1ᵉ / 30llm-statsAuto-déclaré
ChartQA90,0 %2ᵉ / 24llm-statsAuto-déclaré
MMLU85,5 %37ᵉ / 98llm-statsAuto-déclaré
MMLU-Pro80,5 %51ᵉ / 125llm-statsAuto-déclaré
MBPP77,6 %16ᵉ / 33llm-statsAuto-déclaré
MathVista73,7 %8ᵉ / 38llm-statsAuto-déclaré
MMMU73,4 %23ᵉ / 61llm-statsAuto-déclaré
GPQA69,8 %114ᵉ / 213llm-statsAuto-déclaré
MATH61,2 %45ᵉ / 70llm-statsAuto-déclaré
MMMU-Pro59,6 %46ᵉ / 60llm-statsAuto-déclaré
LiveCodeBench43,4 %48ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

Nova 2.0 Pro Preview21.8
▶ Llama 4 Maverick14.3

Code Index

Nova 2.0 Pro Preview34.0
▶ Llama 4 Maverick16.3

Classements Arena (Elo)

CatégorieEloRang
Arena Vision114784ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
DeepInfra0,15 $0,6 $n.d.
artificialanalysis0,35 $0,85 $0,27 $

Prix en dollars US par million de tokens.

Sa tarification se situe 92 % en dessous de la moyenne des LLM similaires, et 32,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Entraînement & empreinte

IndicateurValeur
Compute d'entraînement2,2 × 10²⁴ FLOP
Taille du jeu d'entraînement3,0 × 10¹³
PaysUnited States of America

Notre analyse

Forces. Llama 4 Maverick avait un positionnement solide à sa sortie sur GPQA diamond, un benchmark de questions scientifiques niveau doctorat, où il figurait dans le top 14% des LLM de sa génération. Son résultat sur MATH level 5 indique aussi une capacité correcte sur des problèmes mathématiques structurés, sans atteindre les tout meilleurs modèles. Sa grande fenêtre de contexte constitue son atout le plus net pour traiter de longs documents ou de vastes historiques. Son autre avantage concret est économique : sa tarification se situe très en dessous de la moyenne des LLM similaires et environ 32,2 fois moins cher que les modèles frontière.

Limites et points d'attention. Llama 4 Maverick est aujourd’hui largement dépassé par les modèles plus récents et peut ne plus être proposé dans les catalogues actuels de l’éditeur. Ses classements globaux sont modestes, avec un Intelligence Index en bas de tableau, un Code Index très faible parmi les modèles évalués et un Agentic Index dernier de son groupe. Les résultats sur FrontierMath montrent une quasi-absence de performance sur les mathématiques de recherche très difficiles. Son classement Arena vision reste également bas. Malgré ces limites, l’effort d’entraînement demeure marquant, avec l’équivalent d’environ 290 GPU H100 tournant trois mois.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.