cohere

Command A+

Command A+ est le modèle phare de Cohere, l'éditeur canadien spécialiste de l'IA d'entreprise, sorti le 20 mai 2026 sous licence Apache 2.0. C'est un Mixture-of-Experts de 218 milliards de paramètres au total dont 25 activés (128 experts plus un partagé), qui accepte texte et images et couvre 48 langues avec des citations ancrées natives. Il consolide en un seul jeu de poids ce qui était auparavant quatre modèles distincts (Command A, Reasoning, Vision et Translate).

Il tourne sur un seul GPU B200 (ou deux H100), ce qui le rend déployable sur site.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	cohere
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	20 mai 2026
Connaissances jusqu'à	2024-08-31
Multimodal	oui
Paramètres	218 milliards
Paramètres actifs	25 milliards
Fenêtre de contexte	256 000 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Benchable : Email Classification (Baseline)	99,0 %	24ᵉ / 254	benchable	✅ Mesuré
Benchable : Hallucinations (Baseline)	98,0 %	71ᵉ / 229	benchable	✅ Mesuré
Benchable : Ethics (Baseline)	98,0 %	161ᵉ / 248	benchable	✅ Mesuré
Benchable : General Knowledge (Baseline)	96,5 %	166ᵉ / 250	benchable	✅ Mesuré
Benchable : Coding (Baseline)	88,0 %	128ᵉ / 248	benchable	✅ Mesuré
Benchable : Mathematics (Baseline)	85,0 %	132ᵉ / 217	benchable	✅ Mesuré
Benchable : Reasoning (Baseline)	60,0 %	162ᵉ / 239	benchable	✅ Mesuré
Benchable : Instruction Following (Baseline)	0,0 %	229ᵉ / 252	benchable	✅ Mesuré
AIME 2025	90,0 %	44ᵉ / 108	llm-stats	Auto-déclaré
CharXiv-D	88,0 %	7ᵉ / 16	llm-stats	Auto-déclaré
Tau2 Telecom	85,0 %	18ᵉ / 34	llm-stats	Auto-déclaré
WMT24++	81,0 %	7ᵉ / 23	llm-stats	Auto-déclaré
MathVista	80,6 %	6ᵉ / 38	llm-stats	Auto-déclaré
MMMU	75,1 %	19ᵉ / 61	llm-stats	Auto-déclaré
IFBench	74,0 %	11ᵉ / 27	llm-stats	Auto-déclaré
MMMU-Pro	63,0 %	38ᵉ / 60	llm-stats	Auto-déclaré
CharXiv-R	52,7 %	37ᵉ / 42	llm-stats	Auto-déclaré
SciCode	38,0 %	14ᵉ / 18	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Benchable : Email Classification (Baseline)

DeepSeek-R1100 %

Gemini 2.5 Flash-Lite100 %

GPT-4 Turbo100 %

nova-premier-v199 %

▶ Command A+99 %

WizardLM-2 8x22B95 %

Benchable : Hallucinations (Baseline)

Claude Haiku 4.5100 %

deepseek-chat-v3100 %

gemini-3.1-flash-image100 %

Nemotron Nano 9B v298 %

▶ Command A+98 %

Llama 3.3 70B Instruct96 %

Classements Arena (Elo)

Catégorie	Elo	Rang
Arena Text	1354	168ᵉ

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
Cohere	2,5 $	10 $	n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 28 % au-dessus de la moyenne des LLM similaires, et 1,9 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

Indicateur	Valeur
Coût moyen par benchmark — Benchable	0,15 $
Latence moyenne par benchmark — Benchable	13 min 56 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Sa vocation entreprise est nette : multilingue (48 langues), multimodal, avec des citations ancrées pour le RAG et le function calling, le tout déployable sur une seule machine pour les secteurs régulés. La consolidation de quatre modèles en un simplifie l'exploitation, et la licence Apache 2.0 autorise un usage commercial large. C'est un socle ouvert et polyvalent pour l'IA d'organisation.

Limites et points d'attention. Cohere communique surtout sur des usages métier et moins sur des records de benchmarks généralistes, et certaines spécifications divergent selon les sources (contexte annoncé à 128K dans la documentation primaire, parfois 256K via l'API). Le compute et le coût d'entraînement ne sont pas communiqués. À 25 milliards de paramètres actifs, il reste plus lourd que les petits modèles. Il vise les entreprises cherchant un modèle ouvert, multilingue et souverain.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Arena.ai (arena.ai) · Benchable.ai (benchable.ai).

Command A+

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Classements Arena (Elo)

Tarifs

Coût & vitesse agentiques

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast