Gemma 3 27B

Gemma 3 27B est un LLM de Google publié le 12 mars 2025, sous licence Gemma, avec des poids ouverts et un usage commercial autorisé. Avec 27 milliards de paramètres et une fenêtre de contexte de 131 072 tokens, il visait un compromis entre taille maîtrisée, contexte long et coûts bas.

Gemma 3 27B est un LLM de Google publié le 12 mars 2025, sous licence Gemma, avec des poids ouverts et un usage commercial autorisé. Avec 27 milliards de paramètres et une fenêtre de contexte de 131 072 tokens, il visait un compromis entre taille maîtrisée, contexte long et coûts bas.

Son ancienneté, environ un an, est déjà très longue à l’échelle de l’IA. Gemma 3 27B se lit donc surtout comme un modèle de sa génération : à sa sortie, il se situait dans le top 43% des LLM comparables sur GPQA diamond, mais ses classements globaux indiquent aujourd’hui un net décrochage.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurGoogle
LicenceGemma (open-weights, usage commercial autorisé)
Date de sortie12 mars 2025
Connaissances jusqu'à2024-08-31
Multimodaloui
Paramètres27 milliards
Fenêtre de contexte131 072 tokens
Modalités (entrée → sortie)text,image → text

Indices de synthèse

IndiceValeurRang (LLM)
Intelligence Index4.8135ᵉ / 136
Code Index10.150ᵉ / 50
Math Index20.746ᵉ / 55

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Benchable : Ethics (Baseline)100,0 %1ᵉ / 248benchable✅ Mesuré
Benchable : General Knowledge (Baseline)98,0 %143ᵉ / 250benchable✅ Mesuré
Benchable : Email Classification (Baseline)97,0 %163ᵉ / 254benchable✅ Mesuré
Benchable : Coding (Baseline)89,0 %118ᵉ / 248benchable✅ Mesuré
Benchable : Mathematics (Baseline)84,0 %139ᵉ / 217benchable✅ Mesuré
Epoch: MATH level 574,0 %29ᵉ / 84epoch✅ Mesuré
Benchable : Reasoning (Baseline)66,0 %153ᵉ / 239benchable✅ Mesuré
Epoch: GPQA diamond48,9 %83ᵉ / 132epoch✅ Mesuré
Epoch: OTIS Mock AIME 2024-202519,7 %73ᵉ / 111epoch✅ Mesuré
Benchable : Instruction Following (Baseline)8,0 %223ᵉ / 252benchable✅ Mesuré
GSM8k95,9 %7ᵉ / 47llm-statsAuto-déclaré
IFEval90,4 %13ᵉ / 65llm-statsAuto-déclaré
MATH89,0 %7ᵉ / 70llm-statsAuto-déclaré
HumanEval87,8 %27ᵉ / 65llm-statsAuto-déclaré
BIG-Bench Hard87,6 %3ᵉ / 20llm-statsAuto-déclaré
DocVQA86,6 %23ᵉ / 26llm-statsAuto-déclaré
AI2D84,5 %23ᵉ / 32llm-statsAuto-déclaré
Natural2Code84,5 %3ᵉ / 8llm-statsAuto-déclaré
ChartQA78,0 %21ᵉ / 24llm-statsAuto-déclaré
Global-MMLU-Lite75,1 %6ᵉ / 14llm-statsAuto-déclaré
FACTS Grounding74,9 %7ᵉ / 13llm-statsAuto-déclaré
MBPP74,4 %19ᵉ / 33llm-statsAuto-déclaré
VQAv2 (val)71,0 %2ᵉ / 3llm-statsAuto-déclaré
InfoVQA70,6 %6ᵉ / 9llm-statsAuto-déclaré
MathVista-Mini67,6 %21ᵉ / 23llm-statsAuto-déclaré
MMLU-Pro67,5 %88ᵉ / 125llm-statsAuto-déclaré
TextVQA65,1 %14ᵉ / 15llm-statsAuto-déclaré
MMMU (val)64,9 %9ᵉ / 11llm-statsAuto-déclaré
HiddenMath60,3 %2ᵉ / 13llm-statsAuto-déclaré
Bird-SQL (dev)54,4 %3ᵉ / 7llm-statsAuto-déclaré
WMT24++53,4 %14ᵉ / 23llm-statsAuto-déclaré
GPQA42,4 %177ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench29,7 %61ᵉ / 72llm-statsAuto-déclaré
BIG-Bench Extra Hard19,3 %7ᵉ / 11llm-statsAuto-déclaré
ECLeKTic16,7 %2ᵉ / 8llm-statsAuto-déclaré
SimpleQA10,0 %40ᵉ / 45llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

GPT-5.451.4
Llama 4 Maverick14.3
▶ Gemma 3 27B4.8

Code Index

GPT-5.471.1
Llama 4 Maverick16.3
▶ Gemma 3 27B10.1

Classements Arena (Elo)

CatégorieEloRang
Arena Text1366158ᵉ
Arena Vision115978ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
DeepInfra0,08 $0,16 $n.d.
artificialanalysis0,1095 $0,25 $0,09 $

Prix en dollars US par million de tokens.

Sa tarification se situe 96 % en dessous de la moyenne des LLM similaires, et 60,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Coût & vitesse agentiques

IndicateurValeur
Coût moyen par benchmark — Benchable0 $
Latence moyenne par benchmark — Benchable6 min 34 s

Coûts et durées réels mesurés en exécutant le modèle comme agent. PinchBench = un run complet de 147 tâches (harness OpenClaw) ; Benchable = moyenne par benchmark. Sources : PinchBench, Benchable.ai.

Notre analyse

Forces. Gemma 3 27B garde deux atouts concrets : son coût et certains résultats ciblés. Sa tarification est très économique, 96% sous la moyenne des LLM similaires et environ 60.4 fois moins chère que les modèles frontière, ce qui le plaçait parmi les options les plus accessibles de sa catégorie. Sur Benchable Ethics (Baseline), il atteint le tout premier rang du corpus mesuré, un résultat nettement supérieur au reste de son profil. Ses scores Benchable en General Knowledge, Email Classification, Coding et Mathematics sont élevés en valeur brute, même si les rangs associés le placent plutôt dans le milieu de tableau. Sur Epoch MATH level 5, il reste dans une zone honorable pour un modèle de cette période.

Limites et points d'attention. Les indices synthétiques sont faibles : l’Intelligence Index est presque en bas du classement, le Code Index ferme son groupe de comparaison, et le Math Index reste loin des meilleurs modèles évalués. Les résultats Arena text et Arena vision confirment une position secondaire face aux modèles plus récents. Sa base de connaissances s’arrête au 31 août 2024, ce qui limite son intérêt sur les sujets postérieurs. Comme modèle ancien, Gemma 3 27B est probablement largement dépassé aujourd’hui et souvent retiré des catalogues d’éditeur, malgré une disponibilité en open-weights qui peut conserver un intérêt d’archivage, de comparaison historique ou d’exécution à bas coût.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0 · Benchable.ai (benchable.ai).