xAI

Grok-4.1

Grok-4.1 est un LLM propriétaire de xAI, éditeur américain, publié le 17 novembre 2025. Le modèle se distingue par une fenêtre de contexte de 256 000 tokens, un format adapté aux entrées longues et aux dossiers volumineux lorsque l’accès au modèle est disponible.

Les données concordent sur trois sources et situent Grok-4.1 comme un modèle compétitif en texte, mais moins bien placé en code. Cette fiche présente donc un profil contrasté : contexte étendu et bons résultats textuels, face à une licence fermée et à des classements techniques plus inégaux.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	xAI
Licence	Proprietary (poids non ouverts)
Date de sortie	17 novembre 2025
Multimodal	oui
Fenêtre de contexte	256 000 tokens
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Creative Writing v3	85,4 %	6ᵉ / 12	llm-stats	Auto-déclaré
FigQA	34,0 %	3ᵉ / 3	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1466	30ᵉ
Arena Text	1459	36ᵉ
Arena Code	1209	83ᵉ

Entraînement & empreinte

Indicateur	Valeur
Jeu de données	Unspecified unreleased
Pays	United States of America

Notre analyse

Forces. Grok-4.1 obtient ses meilleurs signaux sur Arena text, où ses deux relevés le placent dans une zone solide du classement, autour du haut de tableau sans rejoindre le tout premier groupe. Cette position indique un modèle crédible pour les tâches textuelles générales, comme la rédaction, la synthèse ou l’analyse de documents, dans la limite des informations disponibles. Sa fenêtre de contexte de 256 000 tokens constitue aussi un atout concret pour traiter de longs contenus en une seule requête, point distinctif par rapport à des modèles à contexte plus réduit.

Limites et points d'attention. Le résultat Arena code est nettement moins favorable, avec un rang éloigné des meilleurs modèles sur ce terrain. Grok-4.1 ne ressort donc pas comme un choix prioritaire lorsque le besoin principal porte sur la programmation ou l’évaluation de code. Sa licence propriétaire et ses poids non ouverts limitent aussi l’audit indépendant, l’hébergement autonome et les usages nécessitant une maîtrise complète du modèle. Grok-4.1 convient surtout aux usages textuels généralistes demandant un large contexte, moins aux projets centrés sur le code ou sur l’ouverture technique.

Sources des données : LLM-Stats (llm-stats.com) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.

Grok-4.1

Caractéristiques

Performances (benchmarks)

Classements Arena (Elo)

Entraînement & empreinte

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast