ERNIE 4.5

ERNIE 4.5 est un LLM propriétaire de Baidu, publié le 25 juin 2025 avec des poids non ouverts. Son format le place dans la famille des modèles généralistes fermés, avec une fenêtre de contexte longue et une taille de 21 milliards de paramètres.

ERNIE 4.5 est un LLM propriétaire de Baidu, publié le 25 juin 2025 avec des poids non ouverts. Son format le place dans la famille des modèles généralistes fermés, avec une fenêtre de contexte longue et une taille de 21 milliards de paramètres.

Son ancienneté d’environ un an pèse déjà lourd à l’échelle de l’IA. La fiche vaut surtout comme photographie d’un modèle de sa période : à sa sortie, ERNIE 4.5 se situait dans le haut de sa génération sur GPQA, mais il doit aujourd’hui être lu comme un modèle probablement dépassé.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurBaidu
LicenceProprietary (poids non ouverts)
Date de sortie25 juin 2025
Multimodalnon
Paramètres21 milliards
Fenêtre de contexte128 000 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
GPQA74,0 %97ᵉ / 213llm-statsAuto-déclaré
ARC-E60,7 %8ᵉ / 8llm-statsAuto-déclaré
PIQA55,2 %11ᵉ / 11llm-statsAuto-déclaré
Winogrande51,3 %22ᵉ / 22llm-statsAuto-déclaré
CLUEWSC48,6 %3ᵉ / 3llm-statsAuto-déclaré
MMLU-Redux43,2 %48ᵉ / 48llm-statsAuto-déclaré
MMLU41,9 %98ᵉ / 98llm-statsAuto-déclaré
C-Eval40,7 %18ᵉ / 18llm-statsAuto-déclaré
ARC-C40,6 %34ᵉ / 34llm-statsAuto-déclaré
MBPP+40,2 %4ᵉ / 4llm-statsAuto-déclaré
CMMLU39,8 %6ᵉ / 6llm-statsAuto-déclaré
HellaSwag33,0 %27ᵉ / 27llm-statsAuto-déclaré
BBH30,4 %12ᵉ / 12llm-statsAuto-déclaré
DROP28,6 %29ᵉ / 29llm-statsAuto-déclaré
AGIEval28,5 %10ᵉ / 10llm-statsAuto-déclaré
GSM8k25,2 %47ᵉ / 47llm-statsAuto-déclaré
HumanEval+25,0 %10ᵉ / 10llm-statsAuto-déclaré
MMLU-Pro16,0 %124ᵉ / 125llm-statsAuto-déclaré
MATH12,4 %70ᵉ / 70llm-statsAuto-déclaré
SimpleQA1,8 %45ᵉ / 45llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, ERNIE 4.5 figurait dans le top 23% des LLM de sa génération sur GPQA, un benchmark centré sur des questions scientifiques difficiles. Ce positionnement indique un niveau solide pour son époque, sans le placer tout en haut du marché. Sa fenêtre de contexte de 128 000 tokens constituait aussi un atout concret pour traiter de longs documents ou maintenir davantage d’informations dans une même interaction. Avec 21 milliards de paramètres, le modèle se situait dans une catégorie relativement compacte face aux très grands LLM fermés, tout en restant associé à un éditeur majeur du secteur chinois.

Limites et points d'attention. ERNIE 4.5 est un modèle propriétaire, ses poids ne sont pas ouverts, ce qui limite l’audit indépendant, l’auto-hébergement et les adaptations directes. Son âge est le principal point faible : environ un an représente un cycle très long dans l’IA générative, et ses performances sont aujourd’hui largement susceptibles d’être dépassées par les modèles haut de gamme plus récents. La couverture repose en outre sur une seule source de données concordante, ce qui impose de traiter son positionnement avec prudence. Il relève davantage d’un repère historique de mi-2025 que d’un choix actuel de référence.


Sources des données : LLM-Stats (llm-stats.com).