Command A+

Command A+ est le modèle phare de Cohere, l'éditeur canadien spécialiste de l'IA d'entreprise, sorti le 20 mai 2026 sous licence Apache 2.0. C'est un Mixture-of-Experts de 218 milliards de paramètres au total dont 25 activés (128 experts plus un partagé), qui accepte texte et images et…

Command A+ est le modèle phare de Cohere, l'éditeur canadien spécialiste de l'IA d'entreprise, sorti le 20 mai 2026 sous licence Apache 2.0. C'est un Mixture-of-Experts de 218 milliards de paramètres au total dont 25 activés (128 experts plus un partagé), qui accepte texte et images et couvre 48 langues avec des citations ancrées natives. Il consolide en un seul jeu de poids ce qui était auparavant quatre modèles distincts (Command A, Reasoning, Vision et Translate).

Il tourne sur un seul GPU B200 (ou deux H100), ce qui le rend déployable sur site.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
Éditeurcohere
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie20 mai 2026
Connaissances jusqu'à2024-08-31
Multimodaloui
Paramètres218 milliards
Paramètres actifs25 milliards
Fenêtre de contexte256 000 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Email Classification (Baseline)99,0 %24ᵉ / 254benchable✅ Mesuré
Benchable : Hallucinations (Baseline)98,0 %71ᵉ / 229benchable✅ Mesuré
Benchable : Ethics (Baseline)98,0 %161ᵉ / 248benchable✅ Mesuré
Benchable : General Knowledge (Baseline)96,5 %166ᵉ / 250benchable✅ Mesuré
Benchable : Coding (Baseline)88,0 %128ᵉ / 248benchable✅ Mesuré
Benchable : Mathematics (Baseline)85,0 %132ᵉ / 217benchable✅ Mesuré
Benchable : Reasoning (Baseline)60,0 %162ᵉ / 239benchable✅ Mesuré
Benchable : Instruction Following (Baseline)0,0 %229ᵉ / 252benchable✅ Mesuré
AIME 202590,0 %44ᵉ / 108llm-statsAuto-déclaré
CharXiv-D88,0 %7ᵉ / 16llm-statsAuto-déclaré
Tau2 Telecom85,0 %18ᵉ / 34llm-statsAuto-déclaré
WMT24++81,0 %7ᵉ / 23llm-statsAuto-déclaré
MathVista80,6 %6ᵉ / 38llm-statsAuto-déclaré
MMMU75,1 %19ᵉ / 61llm-statsAuto-déclaré
IFBench74,0 %11ᵉ / 27llm-statsAuto-déclaré
MMMU-Pro63,0 %38ᵉ / 60llm-statsAuto-déclaré
CharXiv-R52,7 %37ᵉ / 42llm-statsAuto-déclaré
SciCode38,0 %14ᵉ / 18llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Email Classification (Baseline)

DeepSeek-R1100 %
Gemini 2.5 Flash-Lite100 %
GPT-4 Turbo100 %
nova-premier-v199 %
▶ Command A+99 %
WizardLM-2 8x22B95 %

Benchable : Hallucinations (Baseline)

deepseek-chat-v3100 %
gemini-3.1-flash-image100 %
Nemotron Nano 9B v298 %
▶ Command A+98 %
Llama 3.3 70B Instruct96 %

Classements Arena (Elo)

CatégorieEloRang
Arena Text1354168ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
Cohere2,5 $10 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 28 % au-dessus de la moyenne des LLM similaires, et 1,9 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0,15 $
Latence moyenne par benchmark — Benchable13 min 56 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Sa vocation entreprise est nette : multilingue (48 langues), multimodal, avec des citations ancrées pour le RAG et le function calling, le tout déployable sur une seule machine pour les secteurs régulés. La consolidation de quatre modèles en un simplifie l'exploitation, et la licence Apache 2.0 autorise un usage commercial large. C'est un socle ouvert et polyvalent pour l'IA d'organisation.

Limites et points d'attention. Cohere communique surtout sur des usages métier et moins sur des records de benchmarks généralistes, et certaines spécifications divergent selon les sources (contexte annoncé à 128K dans la documentation primaire, parfois 256K via l'API). Le compute et le coût d'entraînement ne sont pas communiqués. À 25 milliards de paramètres actifs, il reste plus lourd que les petits modèles. Il vise les entreprises cherchant un modèle ouvert, multilingue et souverain.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Benchable.ai (benchable.ai).