Gemma 4 E2B

Gemma 4 E2B est un LLM de Google publié le 2 avril 2026 sous licence Apache 2.0, avec des poids ouverts et un usage commercial autorisé. Son format à 5 milliards de paramètres le place dans la catégorie des modèles relativement compacts plutôt que des modèles frontière.

Gemma 4 E2B est un LLM de Google publié le 2 avril 2026 sous licence Apache 2.0, avec des poids ouverts et un usage commercial autorisé. Son format à 5 milliards de paramètres le place dans la catégorie des modèles relativement compacts plutôt que des modèles frontière.

À sa sortie, Gemma 4 E2B se situe dans le top 89% sur GPQA parmi les LLM de sa génération, avec une comparaison menée sur 168 modèles publiés dans une fenêtre de ±9 mois. Sa base de connaissances s’arrête au 1er janvier 2025.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurGoogle
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie2 avril 2026
Connaissances jusqu'à2025-01-01
Multimodaloui
Paramètres5 milliards

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MMMLU67,4 %45ᵉ / 49llm-statsAuto-déclaré
MMLU-Pro60,0 %100ᵉ / 125llm-statsAuto-déclaré
MathVision52,4 %25ᵉ / 31llm-statsAuto-déclaré
MMMU-Pro44,2 %56ᵉ / 60llm-statsAuto-déclaré
LiveCodeBench v644,0 %47ᵉ / 53llm-statsAuto-déclaré
GPQA43,4 %176ᵉ / 213llm-statsAuto-déclaré
AIME 202637,5 %17ᵉ / 17llm-statsAuto-déclaré
t2-bench29,4 %22ᵉ / 23llm-statsAuto-déclaré
MedXpertQA23,5 %11ᵉ / 12llm-statsAuto-déclaré
BIG-Bench Extra Hard21,9 %6ᵉ / 11llm-statsAuto-déclaré
MRCR v219,1 %7ᵉ / 8llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Gemma 4 E2B combine trois caractéristiques concrètes : un éditeur majeur, une licence Apache 2.0 permissive et des poids ouverts utilisables commercialement. Son classement sur GPQA le situe, à sa sortie, dans le haut de sa cohorte pour ce benchmark, ce qui indique un niveau compétitif parmi les LLM publiés à la même période. Son échelle de 5 milliards de paramètres en fait aussi un modèle plus léger que les grands modèles haut de gamme, avec un positionnement adapté aux environnements où la taille du modèle compte.

Limites et points d'attention. Les données disponibles restent limitées : la fiche repose sur une seule source de données concordante, sans autre benchmark fourni pour évaluer le code, les agents, les mathématiques avancées ou les préférences humaines. Le classement disponible concerne uniquement GPQA et ne suffit pas à décrire l’ensemble de ses capacités. La limite de connaissances au 1er janvier 2025 impose aussi une prudence sur les sujets récents. Modèle pertinent pour des usages recherchant un LLM open-weights compact, commercialement exploitable, et situé correctement sur GPQA à sa sortie.


Sources des données : LLM-Stats (llm-stats.com).