Writer

Writer: Palmyra X5

Palmyra X5 est un modèle propriétaire de Writer, l'éditeur américain d'IA générative pour l'entreprise, lancé le 28 avril 2025. C'est un modèle à « raisonnement adaptatif » (profondeur de réflexion variable) bâti sur une architecture Transformer à attention hybride, pensée pour une…

Writer met en avant un argument frappant : un entraînement « à un million de dollars de GPU » sur données entièrement synthétiques. Le chiffre, exact mais exprimé en heures-GPU et sans méthodologie publiée, relève surtout du positionnement marketing sur l'efficience.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Writer
Date de sortie	28 avril 2025
Multimodal	non
Fenêtre de contexte	1 040 000 tokens (≈ 1,0 M)
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Hallucinations (Baseline)	100,0 %	1ᵉ / 229	benchable	✅ Mesuré
Benchable : Ethics (Baseline)	100,0 %	1ᵉ / 248	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	99,4 %	110ᵉ / 250	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	97,2 %	5ᵉ / 217	benchable	✅ Mesuré
Benchable : Email Classification (Baseline)	93,8 %	223ᵉ / 254	benchable	✅ Mesuré
Benchable : Coding (Baseline)	83,3 %	155ᵉ / 248	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	80,6 %	113ᵉ / 239	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	47,1 %	183ᵉ / 252	benchable	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Hallucinations (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

gemini-3.1-flash-image100 %

Qwen2.5 72B Instruct100 %

▶ Palmyra X5100 %

Nemotron Nano 9B v298 %

Benchable : Ethics (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

Gemini 2.5 Flash Lite P…100 %

Qwen2.5 72B Instruct100 %

▶ Palmyra X5100 %

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
Amazon Bedrock	0,6 $	6 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 69 % en dessous de la moyenne des LLM similaires, et 8,1 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,06 $
Latence moyenne par benchmark — Benchable	47 min 04 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Le modèle est explicitement « agent-first » : conçu pour orchestrer de grands volumes d'appels de fonctions et des flottes d'agents d'entreprise, avec une latence basse (appel de fonction de l'ordre de la fraction de seconde, prompt d'un million de tokens traité en une vingtaine de secondes). Son contexte de 1M tokens et son tarif agressif, présenté comme trois à quatre fois moins cher que GPT-4.1 à qualité proche, en font un choix économique pour l'automatisation d'entreprise.

Limites et points d'attention. C'est un modèle fermé : le coût d'entraînement revendiqué reste invérifiable et la méthode n'est pas publiée. Il est texte seul, avec une sortie courte, et son rappel sur très long contexte (MRCR) se situe derrière GPT-4.1. Des mesures tierces signalent une fragilité possible sur le suivi d'instructions fines. Il s'adresse aux entreprises bâtissant des agents à fort volume sur de longs documents.

Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).

Writer: Palmyra X5

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast