Google

Gemma 3n E2B Instructed

Gemma 3n E2B Instructed est un LLM de Google publié le 26 juin 2025. Avec 8 milliards de paramètres et une fenêtre de contexte de 8 192 tokens, il se situe dans un format relativement compact, mais sa fiche doit être lue avec recul: environ un an d’ancienneté constitue déjà un cycle long…

À sa sortie, le modèle se distinguait surtout par son positionnement sur GPQA, où il figurait dans le top 96% des 110 LLM de sa période. Ses poids ne sont pas ouverts, ce qui l’inscrit dans une logique propriétaire plutôt que dans un modèle librement auditable ou réutilisable.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Google
Licence	Proprietary (poids non ouverts)
Date de sortie	26 juin 2025
Connaissances jusqu'à	2024-06-01
Multimodal	oui
Paramètres	8 milliards
Fenêtre de contexte	8 192 tokens
Modalités (entrée → sortie)	text → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
HumanEval	66,5 %	59ᵉ / 65	llm-stats	Auto-déclaré
MMLU	60,1 %	96ᵉ / 98	llm-stats	Auto-déclaré
Global-MMLU-Lite	59,0 %	11ᵉ / 14	llm-stats	Auto-déclaré
MBPP	56,6 %	30ᵉ / 33	llm-stats	Auto-déclaré
Global-MMLU	55,1 %	4ᵉ / 5	llm-stats	Auto-déclaré
MGSM	53,1 %	28ᵉ / 30	llm-stats	Auto-déclaré
WMT24++	42,7 %	20ᵉ / 23	llm-stats	Auto-déclaré
MMLU-Pro	40,5 %	121ᵉ / 125	llm-stats	Auto-déclaré
Include	38,6 %	30ᵉ / 31	llm-stats	Auto-déclaré
HiddenMath	27,7 %	11ᵉ / 13	llm-stats	Auto-déclaré
GPQA	24,8 %	208ᵉ / 213	llm-stats	Auto-déclaré
LiveCodeBench v5	18,6 %	8ᵉ / 9	llm-stats	Auto-déclaré
LiveCodeBench	13,2 %	67ᵉ / 72	llm-stats	Auto-déclaré
Codegolf v2.2	11,0 %	3ᵉ / 4	llm-stats	Auto-déclaré
MMLU-ProX	8,1 %	31ᵉ / 32	llm-stats	Auto-déclaré
AIME 2025	6,7 %	107ᵉ / 108	llm-stats	Auto-déclaré
ECLeKTic	2,5 %	5ᵉ / 8	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Gemma 3n E2B Instructed appartenait au haut du panier de sa génération sur GPQA, un benchmark exigeant souvent utilisé pour évaluer le raisonnement sur des questions complexes. Ce classement est notable pour un modèle de 8 milliards de paramètres, une taille qui le place en dessous des très grands LLM tout en conservant, à l’époque, un niveau compétitif sur cet axe. La fenêtre de 8 192 tokens permettait de traiter des prompts structurés et des documents courts à moyens, sans viser les très longs contextes. La couverture par deux sources concordantes rend ses métadonnées principales, nom, éditeur, date, taille et contexte, suffisamment robustes pour une comparaison historique.

Limites et points d'attention. Le modèle est ancien à l’échelle du secteur: publié en juin 2025, il est probablement largement dépassé par les générations récentes et peut avoir été retiré ou marginalisé dans le catalogue de son éditeur. Sa limite de connaissances au 1er juin 2024 réduit sa pertinence sur l’actualité, les bibliothèques logicielles récentes et les évolutions réglementaires. La licence propriétaire et les poids non ouverts limitent l’audit, l’adaptation locale et la reproductibilité. Aucun chiffre vérifié n’est fourni sur le coût d’entraînement, le calcul mobilisé ou le tarif d’usage, ce qui empêche d’évaluer précisément son intérêt économique.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

Gemma 3n E2B Instructed

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast