Grok 4.1 Fast
Grok 4.1 Fast est un LLM de xAI sorti le 19 novembre 2025, positionné sur le segment très économique. Son principal trait distinctif est une fenêtre de contexte de 2 000 000 tokens, nettement orientée vers les longs documents, les historiques volumineux et les traitements nécessitant…
Grok 4.1 Fast est un LLM de xAI sorti le 19 novembre 2025, positionné sur le segment très économique. Son principal trait distinctif est une fenêtre de contexte de 2 000 000 tokens, nettement orientée vers les longs documents, les historiques volumineux et les traitements nécessitant beaucoup de contexte.
Le modèle combine un coût d’usage bas, 90% sous la moyenne des LLM similaires, avec des résultats LiveBench plus solides en mathématiques et en raisonnement qu’en programmation ou en analyse de données. À sa sortie, il se situait dans le top 34% des LLM de sa génération sur LiveBench: Global average.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | xAI |
| Date de sortie | 19 novembre 2025 |
| Multimodal | oui |
| Fenêtre de contexte | 2 000 000 tokens (≈ 2,0 M) |
| Modalités (entrée → sortie) | text,image,file → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| LiveBench: Mathematics | 83,7 % | 27ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Reasoning | 80,2 % | 17ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Language | 74,3 % | 33ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Coding | 69,6 % | 47ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Global average | 60,0 % | 45ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Data Analysis | 52,2 % | 46ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: Agentic Coding | 31,7 % | 56ᵉ / 76 | livebench | ✅ Mesuré |
| LiveBench: IF | 28,2 % | 57ᵉ / 76 | livebench | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
LiveBench: Mathematics
LiveBench: Reasoning
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1431 | 74ᵉ |
| Arena Code | 1234 | 81ᵉ |
| Arena Vision | 1196 | 60ᵉ |
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| xai | 0,2 $ | 0,5 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 90 % en dessous de la moyenne des LLM similaires, et 24,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Entraînement & empreinte
| Indicateur | Valeur |
|---|---|
| Jeu de données | Unspecified unreleased |
| Pays | United States of America |
Notre analyse
Forces. Grok 4.1 Fast se distingue d’abord par son rapport contexte-prix : une fenêtre de 2,0 M de tokens associée à une tarification très économique, environ 24,2 fois inférieure à celle des modèles frontière. Ses meilleurs signaux viennent de LiveBench: Mathematics (mathématiques) et LiveBench: Reasoning (raisonnement), où il se place dans une zone compétitive par rapport à l’ensemble des modèles évalués. LiveBench: Language (compréhension du langage) reste plus intermédiaire, mais cohérent avec un modèle généraliste à bas coût. À sa sortie, son classement générationnel le plaçait dans le haut tiers des LLM comparables sur la moyenne globale LiveBench, ce qui renforce son positionnement de modèle rapide et abordable plutôt que de modèle haut de gamme.
Limites et points d'attention. Les résultats deviennent moins convaincants sur les tâches de production de code et d’analyse structurée : LiveBench: Coding (programmation) et LiveBench: Data Analysis (analyse de données) le situent plutôt en seconde moitié de tableau. Les classements Arena text, Arena code et Arena vision confirment aussi une réception plus modeste dans les comparaisons directes, avec des rangs éloignés des meilleurs modèles. Les données disponibles reposent sur 5 sources concordantes, mais elles ne documentent pas l’entraînement ni des capacités spécifiques au-delà des mesures listées. Grok 4.1 Fast apparaît surtout adapté aux usages où le coût, le très long contexte et le raisonnement général priment sur la performance maximale en code ou en analyse de données.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · LiveBench (livebench.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.