Grok-2 mini

Grok-2 mini est un LLM propriétaire de xAI, sorti le 13 août 2024, avec des poids non ouverts. Son ancienneté, environ deux ans, est déjà très importante à l’échelle de l’IA générative, ce qui le situe surtout comme un modèle de sa génération plutôt que comme une référence actuelle.

Grok-2 mini est un LLM propriétaire de xAI, sorti le 13 août 2024, avec des poids non ouverts. Son ancienneté, environ deux ans, est déjà très importante à l’échelle de l’IA générative, ce qui le situe surtout comme un modèle de sa génération plutôt que comme une référence actuelle.

Le modèle combine une fenêtre de contexte de 32 768 tokens et des connaissances arrêtées au 31 mai 2024. Les données disponibles, issues de deux sources concordantes, permettent surtout d’évaluer sa place historique dans le catalogue xAI et face aux LLM lancés autour de la même période.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurxAI
LicenceProprietary (poids non ouverts)
Date de sortie13 août 2024
Connaissances jusqu'à2024-05-31
Multimodaloui
Fenêtre de contexte32 768 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
DocVQA93,2 %13ᵉ / 26llm-statsAuto-déclaré
MMLU86,2 %30ᵉ / 98llm-statsAuto-déclaré
HumanEval85,7 %32ᵉ / 65llm-statsAuto-déclaré
MATH73,0 %32ᵉ / 70llm-statsAuto-déclaré
MMLU-Pro72,0 %74ᵉ / 125llm-statsAuto-déclaré
MathVista68,1 %17ᵉ / 38llm-statsAuto-déclaré
MMMU63,2 %38ᵉ / 61llm-statsAuto-déclaré
GPQA51,0 %152ᵉ / 213llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Grok-2 mini se plaçait dans le haut du panier de sa génération sur GPQA, avec un classement dans le top 26% des 27 LLM comparés sur une période de plus ou moins neuf mois. Cette position indique un modèle compétitif pour son époque, notamment dans les évaluations exigeantes utilisées pour départager les LLM généralistes. Sa fenêtre de contexte de 32 768 tokens constituait aussi un atout concret pour traiter des entrées longues, dans la limite des usages compatibles avec un modèle propriétaire de 2024.

Limites et points d'attention. Grok-2 mini est aujourd’hui un modèle ancien, probablement dépassé par les modèles haut de gamme plus récents et souvent retiré du catalogue de son éditeur. Ses connaissances s’arrêtent au 31 mai 2024, ce qui limite sa pertinence sur l’actualité, les bibliothèques logicielles récentes et les évolutions rapides du marché. Sa licence propriétaire empêche l’audit des poids et limite les usages nécessitant un contrôle fin du modèle. L’absence de chiffres publics sur l’entraînement, le coût ou le compute réduit aussi la capacité à apprécier l’effort industriel derrière cette version.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).