Grok 4 Fast
Grok 4 Fast est un LLM propriétaire de xAI, sorti le 28 août 2025, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte, fixée à 2 000 000 tokens, et un tarif présenté comme très économique face aux LLM comparables.
Grok 4 Fast est un LLM propriétaire de xAI, sorti le 28 août 2025, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte, fixée à 2 000 000 tokens, et un tarif présenté comme très économique face aux LLM comparables.
Le modèle se distingue surtout par son rapport coût-performance annoncé : une tarification 90 % inférieure à la moyenne des LLM similaires et environ 24,2 fois moins chère que les modèles frontière. À sa sortie, il se situait dans le top 3 % de sa génération sur GPQA, selon trois sources de données concordantes.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | xAI |
| Licence | Proprietary (poids non ouverts) |
| Date de sortie | 28 août 2025 |
| Connaissances jusqu'à | 2025-09-30 |
| Multimodal | oui |
| Fenêtre de contexte | 2 000 000 tokens (≈ 2,0 M) |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| SimpleQA | 95,0 % | 2ᵉ / 45 | llm-stats | Auto-déclaré |
| HMMT 2025 | 93,3 % | 12ᵉ / 33 | llm-stats | Auto-déclaré |
| AIME 2025 | 92,0 % | 35ᵉ / 108 | llm-stats | Auto-déclaré |
| GPQA | 85,7 % | 37ᵉ / 213 | llm-stats | Auto-déclaré |
| LiveCodeBench | 80,0 % | 9ᵉ / 72 | llm-stats | Auto-déclaré |
| BrowseComp | 44,9 % | 41ᵉ / 51 | llm-stats | Auto-déclaré |
| Humanity's Last Exam | 20,0 % | 53ᵉ / 86 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1404 | 114ᵉ |
| Arena Code | 1150 | 88ᵉ |
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| xai | 0,2 $ | 0,5 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 90 % en dessous de la moyenne des LLM similaires, et 24,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Notre analyse
Forces. Grok 4 Fast affiche un profil atypique pour un modèle propriétaire récent : une fenêtre de contexte très large, un coût d’usage bas et un niveau solide sur GPQA, benchmark centré sur des questions scientifiques et de raisonnement difficiles. À sa sortie, ce classement le plaçait dans le haut du panier des LLM de sa période, ce qui renforce l’intérêt de son positionnement économique. Les résultats Arena Text le situent aussi dans une zone compétitive pour les usages généraux, tandis que le tarif réduit rend le modèle pertinent pour des volumes élevés de tokens.
Limites et points d'attention. Les performances publiques en code sont plus modestes que son signal sur GPQA, avec un classement Arena Code moins favorable que son positionnement en raisonnement général. La licence propriétaire limite l’audit, l’hébergement indépendant et l’adaptation fine par accès aux poids. Le modèle reste aussi moins orienté vers le très haut de gamme que vers l’optimisation du coût, malgré un écart tarifaire marqué avec les modèles frontière. Il correspond surtout à des usages nécessitant beaucoup de contexte et une facture contenue, sans exigence d’ouverture des poids.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai).