Grok-1.5

Grok-1.5 est un LLM propriétaire de xAI, publié le 28 mars 2024 avec des poids non ouverts. À l’échelle de l’IA générative, son ancienneté d’environ deux ans en fait déjà un modèle de génération précédente, à replacer dans le contexte des LLM disponibles au printemps 2024.

Grok-1.5 est un LLM propriétaire de xAI, publié le 28 mars 2024 avec des poids non ouverts. À l’échelle de l’IA générative, son ancienneté d’environ deux ans en fait déjà un modèle de génération précédente, à replacer dans le contexte des LLM disponibles au printemps 2024.

À sa sortie, Grok-1.5 se situait dans les 64% les mieux classés des 11 LLM comparables de sa période sur GPQA. Ce positionnement indique un modèle alors crédible, sans en faire un leader incontestable de sa génération.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurxAI
LicenceProprietary (poids non ouverts)
Date de sortie28 mars 2024
Multimodalnon

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
GSM8k90,0 %26ᵉ / 47llm-statsAuto-déclaré
DocVQA85,6 %24ᵉ / 26llm-statsAuto-déclaré
MMLU81,3 %50ᵉ / 98llm-statsAuto-déclaré
HumanEval74,1 %51ᵉ / 65llm-statsAuto-déclaré
MMMU53,6 %52ᵉ / 61llm-statsAuto-déclaré
MathVista52,8 %33ᵉ / 38llm-statsAuto-déclaré
MMLU-Pro51,0 %108ᵉ / 125llm-statsAuto-déclaré
MATH50,6 %53ᵉ / 70llm-statsAuto-déclaré
GPQA35,9 %192ᵉ / 213llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Grok-1.5 a surtout un intérêt de repère historique dans la trajectoire de xAI. Lors de sa sortie, son résultat sur GPQA le plaçait dans une zone compétitive parmi les LLM de même période, ce qui signale des capacités suffisamment solides pour figurer dans les comparaisons sérieuses de sa génération. Sa nature de modèle propriétaire correspond aussi au positionnement d’un éditeur cherchant à contrôler la distribution, l’accès et l’évolution du modèle plutôt qu’à publier ses poids.

Limites et points d'attention. Grok-1.5 est aujourd’hui un modèle ancien, probablement dépassé par les modèles haut de gamme plus récents et souvent absent des catalogues actifs des éditeurs. Le classement disponible ne montre pas une domination nette à sa sortie, mais plutôt une présence dans le haut élargi du groupe comparé. Les poids non ouverts limitent l’audit indépendant, la reproductibilité et les adaptations locales. La couverture repose sur une seule source de données concordante, ce qui réduit la profondeur de comparaison disponible.


Sources des données : LLM-Stats (llm-stats.com).