Grok-4.1

Grok-4.1 est un LLM propriétaire de xAI, éditeur américain, publié le 17 novembre 2025. Le modèle se distingue par une fenêtre de contexte de 256 000 tokens, un format adapté aux entrées longues et aux dossiers volumineux lorsque l’accès au modèle est disponible.

Grok-4.1 est un LLM propriétaire de xAI, éditeur américain, publié le 17 novembre 2025. Le modèle se distingue par une fenêtre de contexte de 256 000 tokens, un format adapté aux entrées longues et aux dossiers volumineux lorsque l’accès au modèle est disponible.

Les données concordent sur trois sources et situent Grok-4.1 comme un modèle compétitif en texte, mais moins bien placé en code. Cette fiche présente donc un profil contrasté : contexte étendu et bons résultats textuels, face à une licence fermée et à des classements techniques plus inégaux.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurxAI
LicenceProprietary (poids non ouverts)
Date de sortie17 novembre 2025
Multimodaloui
Fenêtre de contexte256 000 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Creative Writing v385,4 %6ᵉ / 12llm-statsAuto-déclaré
FigQA34,0 %3ᵉ / 3llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Classements Arena (Elo)

CatégorieEloRang
Arena Text146630ᵉ
Arena Text145936ᵉ
Arena Code120983ᵉ

Entraînement & empreinte

IndicateurValeur
Jeu de donnéesUnspecified unreleased
PaysUnited States of America

Notre analyse

Forces. Grok-4.1 obtient ses meilleurs signaux sur Arena text, où ses deux relevés le placent dans une zone solide du classement, autour du haut de tableau sans rejoindre le tout premier groupe. Cette position indique un modèle crédible pour les tâches textuelles générales, comme la rédaction, la synthèse ou l’analyse de documents, dans la limite des informations disponibles. Sa fenêtre de contexte de 256 000 tokens constitue aussi un atout concret pour traiter de longs contenus en une seule requête, point distinctif par rapport à des modèles à contexte plus réduit.

Limites et points d'attention. Le résultat Arena code est nettement moins favorable, avec un rang éloigné des meilleurs modèles sur ce terrain. Grok-4.1 ne ressort donc pas comme un choix prioritaire lorsque le besoin principal porte sur la programmation ou l’évaluation de code. Sa licence propriétaire et ses poids non ouverts limitent aussi l’audit indépendant, l’hébergement autonome et les usages nécessitant une maîtrise complète du modèle. Grok-4.1 convient surtout aux usages textuels généralistes demandant un large contexte, moins aux projets centrés sur le code ou sur l’ouverture technique.


Sources des données : LLM-Stats (llm-stats.com) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.