Grok Code Fast

Grok Code Fast est un LLM édité par xAI, identifié dans les évaluations LiveBench avec un profil orienté vers la programmation. Son nom met l’accent sur le code, et ses résultats disponibles confirment que le Coding est son domaine le plus favorable par rapport à ses autres mesures.

Grok Code Fast est un LLM édité par xAI, identifié dans les évaluations LiveBench avec un profil orienté vers la programmation. Son nom met l’accent sur le code, et ses résultats disponibles confirment que le Coding est son domaine le plus favorable par rapport à ses autres mesures.

La fiche repose sur une seule source de données concordante. Les scores LiveBench disponibles couvrent la programmation, les mathématiques, l’analyse de données, la compréhension du langage et le raisonnement, ce qui donne une lecture assez transversale de ses performances.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurxAI

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
LiveBench: Coding64,4 %66ᵉ / 76livebench✅ Mesuré
LiveBench: Mathematics56,0 %71ᵉ / 76livebench✅ Mesuré
LiveBench: Data Analysis49,0 %56ᵉ / 76livebench✅ Mesuré
LiveBench: Language48,6 %70ᵉ / 76livebench✅ Mesuré
LiveBench: Global average45,1 %67ᵉ / 76livebench✅ Mesuré
LiveBench: Reasoning42,3 %61ᵉ / 76livebench✅ Mesuré
LiveBench: Agentic Coding33,3 %52ᵉ / 76livebench✅ Mesuré
LiveBench: IF22,3 %67ᵉ / 76livebench✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

LiveBench: Coding

▶ Grok Code Fast64 %

LiveBench: Mathematics

Qwen3.7 Max85 %
▶ Grok Code Fast56 %
Nemotron 3 Ultra55 %

Notre analyse

Forces. Le meilleur signal de Grok Code Fast apparaît sur LiveBench: Coding (programmation), où le modèle obtient son résultat le plus élevé parmi les catégories publiées. L’analyse de données constitue son deuxième point relativement plus solide, avec un rang moins défavorable que ceux observés en mathématiques, en langage et en moyenne globale. Ce profil suggère un modèle plus pertinent à examiner sur des tâches techniques structurées que sur des usages généralistes exigeant une compréhension linguistique ou un raisonnement étendu.

Limites et points d'attention. Les résultats LiveBench placent Grok Code Fast dans le bas du classement global, avec des positions faibles en mathématiques, en compréhension du langage et en raisonnement. Le score moyen confirme un niveau inférieur à la majorité des modèles comparés dans ce jeu d’évaluation. La couverture repose aussi sur une seule source concordante, ce qui limite la diversité des signaux disponibles. Le modèle apparaît donc surtout pertinent pour situer l’offre de xAI sur le code dans LiveBench, plutôt que comme référence haut de gamme polyvalente.


Sources des données : LiveBench (livebench.ai).