Writer: Palmyra X5
Palmyra X5 est un modèle propriétaire de Writer, l'éditeur américain d'IA générative pour l'entreprise, lancé le 28 avril 2025. C'est un modèle à « raisonnement adaptatif » (profondeur de réflexion variable) bâti sur une architecture Transformer à attention hybride, pensée pour une…
Palmyra X5 est un modèle propriétaire de Writer, l'éditeur américain d'IA générative pour l'entreprise, lancé le 28 avril 2025. C'est un modèle à « raisonnement adaptatif » (profondeur de réflexion variable) bâti sur une architecture Transformer à attention hybride, pensée pour une inférence rapide et une mémoire longue : sa fenêtre de contexte atteint un million de tokens. Il est texte seul et fermé.
Writer met en avant un argument frappant : un entraînement « à un million de dollars de GPU » sur données entièrement synthétiques. Le chiffre, exact mais exprimé en heures-GPU et sans méthodologie publiée, relève surtout du positionnement marketing sur l'efficience.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Writer |
| Date de sortie | 28 avril 2025 |
| Multimodal | non |
| Fenêtre de contexte | 1 040 000 tokens (≈ 1,0 M) |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : Hallucinations (Baseline) | 100,0 % | 1ᵉ / 229 | benchable | ✅ Mesuré |
| Benchable : Ethics (Baseline) | 100,0 % | 1ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : General Knowledge (Baseline) | 99,4 % | 110ᵉ / 250 | benchable | ✅ Mesuré |
| Benchable : Mathematics (Baseline) | 97,2 % | 5ᵉ / 217 | benchable | ✅ Mesuré |
| Benchable : Email Classification (Baseline) | 93,8 % | 223ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : Coding (Baseline) | 83,3 % | 155ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Reasoning (Baseline) | 80,6 % | 113ᵉ / 239 | benchable | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 47,1 % | 183ᵉ / 252 | benchable | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Benchable : Hallucinations (Baseline)
Benchable : Ethics (Baseline)
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Amazon Bedrock | 0,6 $ | 6 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 69 % en dessous de la moyenne des LLM similaires, et 8,1 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0,06 $ |
| Latence moyenne par benchmark — Benchable | 47 min 04 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. Le modèle est explicitement « agent-first » : conçu pour orchestrer de grands volumes d'appels de fonctions et des flottes d'agents d'entreprise, avec une latence basse (appel de fonction de l'ordre de la fraction de seconde, prompt d'un million de tokens traité en une vingtaine de secondes). Son contexte de 1M tokens et son tarif agressif, présenté comme trois à quatre fois moins cher que GPT-4.1 à qualité proche, en font un choix économique pour l'automatisation d'entreprise.
Limites et points d'attention. C'est un modèle fermé : le coût d'entraînement revendiqué reste invérifiable et la méthode n'est pas publiée. Il est texte seul, avec une sortie courte, et son rappel sur très long contexte (MRCR) se situe derrière GPT-4.1. Des mesures tierces signalent une fragilité possible sur le suivi d'instructions fines. Il s'adresse aux entreprises bâtissant des agents à fort volume sur de longs documents.
Sources des données : OpenRouter (openrouter.ai) · Benchable.ai (benchable.ai).