xAI

Grok 4 Fast

Grok 4 Fast est un LLM propriétaire de xAI, sorti le 28 août 2025, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte, fixée à 2 000 000 tokens, et un tarif présenté comme très économique face aux LLM comparables.

Le modèle se distingue surtout par son rapport coût-performance annoncé : une tarification 90 % inférieure à la moyenne des LLM similaires et environ 24,2 fois moins chère que les modèles frontière. À sa sortie, il se situait dans le top 3 % de sa génération sur GPQA, selon trois sources de données concordantes.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	xAI
Licence	Proprietary (poids non ouverts)
Date de sortie	28 août 2025
Connaissances jusqu'à	2025-09-30
Multimodal	oui
Fenêtre de contexte	2 000 000 tokens (≈ 2,0 M)
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
SimpleQA	95,0 %	2ᵉ / 45	llm-stats	Auto-déclaré
HMMT 2025	93,3 %	12ᵉ / 33	llm-stats	Auto-déclaré
AIME 2025	92,0 %	35ᵉ / 108	llm-stats	Auto-déclaré
GPQA	85,7 %	37ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench	80,0 %	9ᵉ / 72	llm-stats	Auto-déclaré
BrowseComp	44,9 %	41ᵉ / 51	llm-stats	Auto-déclaré
Humanity's Last Exam	20,0 %	53ᵉ / 86	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1404	114ᵉ
Arena Code	1150	88ᵉ

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
xai	0,2 $	0,5 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 90 % en dessous de la moyenne des LLM similaires, et 24,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. Grok 4 Fast affiche un profil atypique pour un modèle propriétaire récent : une fenêtre de contexte très large, un coût d’usage bas et un niveau solide sur GPQA, benchmark centré sur des questions scientifiques et de raisonnement difficiles. À sa sortie, ce classement le plaçait dans le haut du panier des LLM de sa période, ce qui renforce l’intérêt de son positionnement économique. Les résultats Arena Text le situent aussi dans une zone compétitive pour les usages généraux, tandis que le tarif réduit rend le modèle pertinent pour des volumes élevés de tokens.

Limites et points d'attention. Les performances publiques en code sont plus modestes que son signal sur GPQA, avec un classement Arena Code moins favorable que son positionnement en raisonnement général. La licence propriétaire limite l’audit, l’hébergement indépendant et l’adaptation fine par accès aux poids. Le modèle reste aussi moins orienté vers le très haut de gamme que vers l’optimisation du coût, malgré un écart tarifaire marqué avec les modèles frontière. Il correspond surtout à des usages nécessitant beaucoup de contexte et une facture contenue, sans exigence d’ouverture des poids.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai).

Grok 4 Fast

Caractéristiques

Performances (benchmarks)

Classements Arena (Elo)

Tarifs

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast