Baidu

ERNIE 4.5

ERNIE 4.5 est un LLM propriétaire de Baidu, publié le 25 juin 2025 avec des poids non ouverts. Son format le place dans la famille des modèles généralistes fermés, avec une fenêtre de contexte longue et une taille de 21 milliards de paramètres.

Son ancienneté d’environ un an pèse déjà lourd à l’échelle de l’IA. La fiche vaut surtout comme photographie d’un modèle de sa période : à sa sortie, ERNIE 4.5 se situait dans le haut de sa génération sur GPQA, mais il doit aujourd’hui être lu comme un modèle probablement dépassé.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Baidu
Licence	Proprietary (poids non ouverts)
Date de sortie	25 juin 2025
Multimodal	non
Paramètres	21 milliards
Fenêtre de contexte	128 000 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
GPQA	74,0 %	97ᵉ / 213	llm-stats	Auto-déclaré
ARC-E	60,7 %	8ᵉ / 8	llm-stats	Auto-déclaré
PIQA	55,2 %	11ᵉ / 11	llm-stats	Auto-déclaré
Winogrande	51,3 %	22ᵉ / 22	llm-stats	Auto-déclaré
CLUEWSC	48,6 %	3ᵉ / 3	llm-stats	Auto-déclaré
MMLU-Redux	43,2 %	48ᵉ / 48	llm-stats	Auto-déclaré
MMLU	41,9 %	98ᵉ / 98	llm-stats	Auto-déclaré
C-Eval	40,7 %	18ᵉ / 18	llm-stats	Auto-déclaré
ARC-C	40,6 %	34ᵉ / 34	llm-stats	Auto-déclaré
MBPP+	40,2 %	4ᵉ / 4	llm-stats	Auto-déclaré
CMMLU	39,8 %	6ᵉ / 6	llm-stats	Auto-déclaré
HellaSwag	33,0 %	27ᵉ / 27	llm-stats	Auto-déclaré
BBH	30,4 %	12ᵉ / 12	llm-stats	Auto-déclaré
DROP	28,6 %	29ᵉ / 29	llm-stats	Auto-déclaré
AGIEval	28,5 %	10ᵉ / 10	llm-stats	Auto-déclaré
GSM8k	25,2 %	47ᵉ / 47	llm-stats	Auto-déclaré
HumanEval+	25,0 %	10ᵉ / 10	llm-stats	Auto-déclaré
MMLU-Pro	16,0 %	124ᵉ / 125	llm-stats	Auto-déclaré
MATH	12,4 %	70ᵉ / 70	llm-stats	Auto-déclaré
SimpleQA	1,8 %	45ᵉ / 45	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, ERNIE 4.5 figurait dans le top 23% des LLM de sa génération sur GPQA, un benchmark centré sur des questions scientifiques difficiles. Ce positionnement indique un niveau solide pour son époque, sans le placer tout en haut du marché. Sa fenêtre de contexte de 128 000 tokens constituait aussi un atout concret pour traiter de longs documents ou maintenir davantage d’informations dans une même interaction. Avec 21 milliards de paramètres, le modèle se situait dans une catégorie relativement compacte face aux très grands LLM fermés, tout en restant associé à un éditeur majeur du secteur chinois.

Limites et points d'attention. ERNIE 4.5 est un modèle propriétaire, ses poids ne sont pas ouverts, ce qui limite l’audit indépendant, l’auto-hébergement et les adaptations directes. Son âge est le principal point faible : environ un an représente un cycle très long dans l’IA générative, et ses performances sont aujourd’hui largement susceptibles d’être dépassées par les modèles haut de gamme plus récents. La couverture repose en outre sur une seule source de données concordante, ce qui impose de traiter son positionnement avec prudence. Il relève davantage d’un repère historique de mi-2025 que d’un choix actuel de référence.

Sources des données : LLM-Stats (llm-stats.com).

ERNIE 4.5

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast