Grok 4 Fast

Grok 4 Fast est un LLM propriétaire de xAI, sorti le 28 août 2025, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte, fixée à 2 000 000 tokens, et un tarif présenté comme très économique face aux LLM comparables.

Grok 4 Fast est un LLM propriétaire de xAI, sorti le 28 août 2025, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte, fixée à 2 000 000 tokens, et un tarif présenté comme très économique face aux LLM comparables.

Le modèle se distingue surtout par son rapport coût-performance annoncé : une tarification 90 % inférieure à la moyenne des LLM similaires et environ 24,2 fois moins chère que les modèles frontière. À sa sortie, il se situait dans le top 3 % de sa génération sur GPQA, selon trois sources de données concordantes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurxAI
LicenceProprietary (poids non ouverts)
Date de sortie28 août 2025
Connaissances jusqu'à2025-09-30
Multimodaloui
Fenêtre de contexte2 000 000 tokens (≈ 2,0 M)
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
SimpleQA95,0 %2ᵉ / 45llm-statsAuto-déclaré
HMMT 202593,3 %12ᵉ / 33llm-statsAuto-déclaré
AIME 202592,0 %35ᵉ / 108llm-statsAuto-déclaré
GPQA85,7 %37ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench80,0 %9ᵉ / 72llm-statsAuto-déclaré
BrowseComp44,9 %41ᵉ / 51llm-statsAuto-déclaré
Humanity's Last Exam20,0 %53ᵉ / 86llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Classements Arena (Elo)

CatégorieEloRang
Arena Text1404114ᵉ
Arena Code115088ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
xai0,2 $0,5 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 90 % en dessous de la moyenne des LLM similaires, et 24,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. Grok 4 Fast affiche un profil atypique pour un modèle propriétaire récent : une fenêtre de contexte très large, un coût d’usage bas et un niveau solide sur GPQA, benchmark centré sur des questions scientifiques et de raisonnement difficiles. À sa sortie, ce classement le plaçait dans le haut du panier des LLM de sa période, ce qui renforce l’intérêt de son positionnement économique. Les résultats Arena Text le situent aussi dans une zone compétitive pour les usages généraux, tandis que le tarif réduit rend le modèle pertinent pour des volumes élevés de tokens.

Limites et points d'attention. Les performances publiques en code sont plus modestes que son signal sur GPQA, avec un classement Arena Code moins favorable que son positionnement en raisonnement général. La licence propriétaire limite l’audit, l’hébergement indépendant et l’adaptation fine par accès aux poids. Le modèle reste aussi moins orienté vers le très haut de gamme que vers l’optimisation du coût, malgré un écart tarifaire marqué avec les modèles frontière. Il correspond surtout à des usages nécessitant beaucoup de contexte et une facture contenue, sans exigence d’ouverture des poids.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai).