Grok-4.1
Grok-4.1 est un LLM propriétaire de xAI, éditeur américain, publié le 17 novembre 2025. Le modèle se distingue par une fenêtre de contexte de 256 000 tokens, un format adapté aux entrées longues et aux dossiers volumineux lorsque l’accès au modèle est disponible.
Grok-4.1 est un LLM propriétaire de xAI, éditeur américain, publié le 17 novembre 2025. Le modèle se distingue par une fenêtre de contexte de 256 000 tokens, un format adapté aux entrées longues et aux dossiers volumineux lorsque l’accès au modèle est disponible.
Les données concordent sur trois sources et situent Grok-4.1 comme un modèle compétitif en texte, mais moins bien placé en code. Cette fiche présente donc un profil contrasté : contexte étendu et bons résultats textuels, face à une licence fermée et à des classements techniques plus inégaux.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | xAI |
| Licence | Proprietary (poids non ouverts) |
| Date de sortie | 17 novembre 2025 |
| Multimodal | oui |
| Fenêtre de contexte | 256 000 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Creative Writing v3 | 85,4 % | 6ᵉ / 12 | llm-stats | Auto-déclaré |
| FigQA | 34,0 % | 3ᵉ / 3 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1466 | 30ᵉ |
| Arena Text | 1459 | 36ᵉ |
| Arena Code | 1209 | 83ᵉ |
Entraînement & empreinte
| Indicateur | Valeur |
|---|---|
| Jeu de données | Unspecified unreleased |
| Pays | United States of America |
Notre analyse
Forces. Grok-4.1 obtient ses meilleurs signaux sur Arena text, où ses deux relevés le placent dans une zone solide du classement, autour du haut de tableau sans rejoindre le tout premier groupe. Cette position indique un modèle crédible pour les tâches textuelles générales, comme la rédaction, la synthèse ou l’analyse de documents, dans la limite des informations disponibles. Sa fenêtre de contexte de 256 000 tokens constitue aussi un atout concret pour traiter de longs contenus en une seule requête, point distinctif par rapport à des modèles à contexte plus réduit.
Limites et points d'attention. Le résultat Arena code est nettement moins favorable, avec un rang éloigné des meilleurs modèles sur ce terrain. Grok-4.1 ne ressort donc pas comme un choix prioritaire lorsque le besoin principal porte sur la programmation ou l’évaluation de code. Sa licence propriétaire et ses poids non ouverts limitent aussi l’audit indépendant, l’hébergement autonome et les usages nécessitant une maîtrise complète du modèle. Grok-4.1 convient surtout aux usages textuels généralistes demandant un large contexte, moins aux projets centrés sur le code ou sur l’ouverture technique.
Sources des données : LLM-Stats (llm-stats.com) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.