Command A+
Command A+ est le modèle phare de Cohere, l'éditeur canadien spécialiste de l'IA d'entreprise, sorti le 20 mai 2026 sous licence Apache 2.0. C'est un Mixture-of-Experts de 218 milliards de paramètres au total dont 25 activés (128 experts plus un partagé), qui accepte texte et images et…
Command A+ est le modèle phare de Cohere, l'éditeur canadien spécialiste de l'IA d'entreprise, sorti le 20 mai 2026 sous licence Apache 2.0. C'est un Mixture-of-Experts de 218 milliards de paramètres au total dont 25 activés (128 experts plus un partagé), qui accepte texte et images et couvre 48 langues avec des citations ancrées natives. Il consolide en un seul jeu de poids ce qui était auparavant quatre modèles distincts (Command A, Reasoning, Vision et Translate).
Il tourne sur un seul GPU B200 (ou deux H100), ce qui le rend déployable sur site.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | cohere |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 20 mai 2026 |
| Connaissances jusqu'à | 2024-08-31 |
| Multimodal | oui |
| Paramètres | 218 milliards |
| Paramètres actifs | 25 milliards |
| Fenêtre de contexte | 256 000 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Benchable : Email Classification (Baseline) | 99,0 % | 24ᵉ / 254 | benchable | ✅ Mesuré |
| Benchable : Hallucinations (Baseline) | 98,0 % | 71ᵉ / 229 | benchable | ✅ Mesuré |
| Benchable : Ethics (Baseline) | 98,0 % | 161ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : General Knowledge (Baseline) | 96,5 % | 166ᵉ / 250 | benchable | ✅ Mesuré |
| Benchable : Coding (Baseline) | 88,0 % | 128ᵉ / 248 | benchable | ✅ Mesuré |
| Benchable : Mathematics (Baseline) | 85,0 % | 132ᵉ / 217 | benchable | ✅ Mesuré |
| Benchable : Reasoning (Baseline) | 60,0 % | 162ᵉ / 239 | benchable | ✅ Mesuré |
| Benchable : Instruction Following (Baseline) | 0,0 % | 229ᵉ / 252 | benchable | ✅ Mesuré |
| AIME 2025 | 90,0 % | 44ᵉ / 108 | llm-stats | Auto-déclaré |
| CharXiv-D | 88,0 % | 7ᵉ / 16 | llm-stats | Auto-déclaré |
| Tau2 Telecom | 85,0 % | 18ᵉ / 34 | llm-stats | Auto-déclaré |
| WMT24++ | 81,0 % | 7ᵉ / 23 | llm-stats | Auto-déclaré |
| MathVista | 80,6 % | 6ᵉ / 38 | llm-stats | Auto-déclaré |
| MMMU | 75,1 % | 19ᵉ / 61 | llm-stats | Auto-déclaré |
| IFBench | 74,0 % | 11ᵉ / 27 | llm-stats | Auto-déclaré |
| MMMU-Pro | 63,0 % | 38ᵉ / 60 | llm-stats | Auto-déclaré |
| CharXiv-R | 52,7 % | 37ᵉ / 42 | llm-stats | Auto-déclaré |
| SciCode | 38,0 % | 14ᵉ / 18 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Benchable : Email Classification (Baseline)
Benchable : Hallucinations (Baseline)
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| Arena Text | 1354 | 168ᵉ |
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Cohere | 2,5 $ | 10 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 28 % au-dessus de la moyenne des LLM similaires, et 1,9 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Coût & vitesse agentiques
| Indicateur | Valeur |
|---|---|
| Coût moyen par benchmark — Benchable | 0,15 $ |
| Latence moyenne par benchmark — Benchable | 13 min 56 s |
Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.
Notre analyse
Forces. Sa vocation entreprise est nette : multilingue (48 langues), multimodal, avec des citations ancrées pour le RAG et le function calling, le tout déployable sur une seule machine pour les secteurs régulés. La consolidation de quatre modèles en un simplifie l'exploitation, et la licence Apache 2.0 autorise un usage commercial large. C'est un socle ouvert et polyvalent pour l'IA d'organisation.
Limites et points d'attention. Cohere communique surtout sur des usages métier et moins sur des records de benchmarks généralistes, et certaines spécifications divergent selon les sources (contexte annoncé à 128K dans la documentation primaire, parfois 256K via l'API). Le compute et le coût d'entraînement ne sont pas communiqués. À 25 milliards de paramètres actifs, il reste plus lourd que les petits modèles. Il vise les entreprises cherchant un modèle ouvert, multilingue et souverain.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Benchable.ai (benchable.ai).