xAI

Grok Code Fast

Grok Code Fast est un LLM édité par xAI, identifié dans les évaluations LiveBench avec un profil orienté vers la programmation. Son nom met l’accent sur le code, et ses résultats disponibles confirment que le Coding est son domaine le plus favorable par rapport à ses autres mesures.

La fiche repose sur une seule source de données concordante. Les scores LiveBench disponibles couvrent la programmation, les mathématiques, l’analyse de données, la compréhension du langage et le raisonnement, ce qui donne une lecture assez transversale de ses performances.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	xAI

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
LiveBench: Coding	64,4 %	66ᵉ / 76	livebench	✅ Mesuré
LiveBench: Mathematics	56,0 %	71ᵉ / 76	livebench	✅ Mesuré
LiveBench: Data Analysis	49,0 %	56ᵉ / 76	livebench	✅ Mesuré
LiveBench: Language	48,6 %	70ᵉ / 76	livebench	✅ Mesuré
LiveBench: Global average	45,1 %	67ᵉ / 76	livebench	✅ Mesuré
LiveBench: Reasoning	42,3 %	61ᵉ / 76	livebench	✅ Mesuré
LiveBench: Agentic Coding	33,3 %	52ᵉ / 76	livebench	✅ Mesuré
LiveBench: IF	22,3 %	67ᵉ / 76	livebench	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

LiveBench: Coding

GPT-5.2 Codex84 %

Claude Opus 4.782 %

Gemini 3.5 Flash78 %

Devstral 267 %

▶ Grok Code Fast64 %

LiveBench: Mathematics

GPT-5.596 %

Claude Opus 4.895 %

Gemini 3.1 Pro Preview91 %

Qwen3.7 Max85 %

▶ Grok Code Fast56 %

Nemotron 3 Ultra55 %

Notre analyse

Forces. Le meilleur signal de Grok Code Fast apparaît sur LiveBench: Coding (programmation), où le modèle obtient son résultat le plus élevé parmi les catégories publiées. L’analyse de données constitue son deuxième point relativement plus solide, avec un rang moins défavorable que ceux observés en mathématiques, en langage et en moyenne globale. Ce profil suggère un modèle plus pertinent à examiner sur des tâches techniques structurées que sur des usages généralistes exigeant une compréhension linguistique ou un raisonnement étendu.

Limites et points d'attention. Les résultats LiveBench placent Grok Code Fast dans le bas du classement global, avec des positions faibles en mathématiques, en compréhension du langage et en raisonnement. Le score moyen confirme un niveau inférieur à la majorité des modèles comparés dans ce jeu d’évaluation. La couverture repose aussi sur une seule source concordante, ce qui limite la diversité des signaux disponibles. Le modèle apparaît donc surtout pertinent pour situer l’offre de xAI sur le code dans LiveBench, plutôt que comme référence haut de gamme polyvalente.

Sources des données : LiveBench (livebench.ai).

Grok Code Fast

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Devstral 2