Gemini 2.0 Flash

Gemini 2.0 Flash est un LLM propriétaire de Google, sorti le 21 janvier 2025, avec des poids non ouverts. À environ un an d’ancienneté, il appartient déjà à une génération longue à l’échelle de l’IA, à analyser surtout par rapport aux modèles disponibles au moment de son lancement.

Gemini 2.0 Flash est un LLM propriétaire de Google, sorti le 21 janvier 2025, avec des poids non ouverts. À environ un an d’ancienneté, il appartient déjà à une génération longue à l’échelle de l’IA, à analyser surtout par rapport aux modèles disponibles au moment de son lancement.

Son profil combine une très grande fenêtre de contexte, proche de 1,0 M de tokens, et un positionnement tarifaire très économique. Son prix est nettement inférieur à la moyenne des LLM similaires et reste très en dessous des modèles frontière, ce qui en faisait un modèle Flash orienté volume et coût maîtrisé.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurGoogle
LicenceProprietary (poids non ouverts)
Date de sortie21 janvier 2025
Connaissances jusqu'à2024-08-01
Multimodaloui
Fenêtre de contexte1 048 576 tokens (≈ 1,0 M)
Modalités (entrée → sortie)text,image → text

Indices de synthèse

IndiceValeurRang (LLM)
Intelligence Index12.3120ᵉ / 136
Math Index21.744ᵉ / 55

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: MATH level 582,2 %24ᵉ / 84epoch✅ Mesuré
Epoch: GPQA diamond64,1 %66ᵉ / 132epoch✅ Mesuré
Epoch: OTIS Mock AIME 2024-202531,1 %67ᵉ / 111epoch✅ Mesuré
Epoch: FrontierMath-2025-02-28-Private1,7 %56ᵉ / 69epoch✅ Mesuré
Epoch: FrontierMath-2025-02-28-Public0,0 %35ᵉ / 64epoch✅ Mesuré
Natural2Code92,9 %1ᵉ / 8llm-statsAuto-déclaré
MATH89,7 %5ᵉ / 70llm-statsAuto-déclaré
FACTS Grounding83,6 %4ᵉ / 13llm-statsAuto-déclaré
MMLU-Pro76,4 %64ᵉ / 125llm-statsAuto-déclaré
AIME 202473,3 %36ᵉ / 52llm-statsAuto-déclaré
EgoSchema71,5 %5ᵉ / 9llm-statsAuto-déclaré
MMMU70,7 %27ᵉ / 61llm-statsAuto-déclaré
MRCR69,2 %4ᵉ / 7llm-statsAuto-déclaré
HiddenMath63,0 %1ᵉ / 13llm-statsAuto-déclaré
GPQA62,1 %137ᵉ / 213llm-statsAuto-déclaré
Bird-SQL (dev)56,9 %2ᵉ / 7llm-statsAuto-déclaré
Vibe-Eval56,3 %4ᵉ / 8llm-statsAuto-déclaré
CoVoST239,2 %2ᵉ / 4llm-statsAuto-déclaré
LiveCodeBench35,1 %52ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

GPT-5.451.4
Gemini 3.1 Pro Preview46.5
Llama 4 Maverick14.3
▶ Gemini 2.0 Flash12.3

Math Index

GPT-5 Codex98.7
gemini-3-flash97.0
DeepSeek V3.292.0
Qwen3-235B-A22B-Instruc…71.7
▶ Gemini 2.0 Flash21.7
Llama 4 Maverick19.3

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
artificialanalysis0,15 $0,6 $0,025 $

Prix en dollars US par million de tokens.

Sa tarification se situe 92 % en dessous de la moyenne des LLM similaires, et 32,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. Gemini 2.0 Flash se distingue d’abord par sa fenêtre de contexte de 1 048 576 tokens, un format adapté aux entrées très longues à son époque. À sa sortie, il figurait dans le top 11% des LLM de sa génération sur GPQA diamond, un benchmark de questions scientifiques niveau doctorat, ce qui situait ses capacités de raisonnement scientifique dans le haut du panier de sa période. Sur MATH level 5, il affiche aussi un résultat solide, davantage favorable que ses indices globaux ne le suggèrent. Son autre force majeure reste le coût : la tarification est très économique, 92% sous la moyenne des LLM similaires et environ 32,2 fois inférieure à celle des modèles frontière.

Limites et points d’attention. Son ancienneté pèse fortement : un modèle sorti début 2025 est probablement largement dépassé aujourd’hui, et ce type de génération est souvent retiré du catalogue de l’éditeur. Les classements globaux le placent bas sur l’Intelligence Index et en retrait sur le Math Index. Les résultats deviennent faibles sur OTIS Mock AIME, puis très faibles sur FrontierMath, qui mesure des mathématiques de recherche très difficiles. Les connaissances s’arrêtent au 2024-08-01, et la licence propriétaire limite l’audit ou l’hébergement indépendant.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Epoch AI (epoch.ai), CC-BY-4.0.