Google

Gemini 2.0 Flash

Gemini 2.0 Flash est un LLM propriétaire de Google, sorti le 21 janvier 2025, avec des poids non ouverts. À environ un an d’ancienneté, il appartient déjà à une génération longue à l’échelle de l’IA, à analyser surtout par rapport aux modèles disponibles au moment de son lancement.

Son profil combine une très grande fenêtre de contexte, proche de 1,0 M de tokens, et un positionnement tarifaire très économique. Son prix est nettement inférieur à la moyenne des LLM similaires et reste très en dessous des modèles frontière, ce qui en faisait un modèle Flash orienté volume et coût maîtrisé.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Google
Licence	Proprietary (poids non ouverts)
Date de sortie	21 janvier 2025
Connaissances jusqu'à	2024-08-01
Multimodal	oui
Fenêtre de contexte	1 048 576 tokens (≈ 1,0 M)
Modalités (entrée → sortie)	text,image → text

Indices de synthèse

Indice	Valeur	Rang (LLM)
Intelligence Index	12.3	120ᵉ / 136
Math Index	21.7	44ᵉ / 55

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Epoch: MATH level 5	82,2 %	24ᵉ / 84	epoch	✅ Mesuré
Epoch: GPQA diamond	64,1 %	66ᵉ / 132	epoch	✅ Mesuré
Epoch: OTIS Mock AIME 2024-2025	31,1 %	67ᵉ / 111	epoch	✅ Mesuré
Epoch: FrontierMath-2025-02-28-Private	1,7 %	56ᵉ / 69	epoch	✅ Mesuré
Epoch: FrontierMath-2025-02-28-Public	0,0 %	35ᵉ / 64	epoch	✅ Mesuré
Natural2Code	92,9 %	1ᵉ / 8	llm-stats	Auto-déclaré
MATH	89,7 %	5ᵉ / 70	llm-stats	Auto-déclaré
FACTS Grounding	83,6 %	4ᵉ / 13	llm-stats	Auto-déclaré
MMLU-Pro	76,4 %	64ᵉ / 125	llm-stats	Auto-déclaré
AIME 2024	73,3 %	36ᵉ / 52	llm-stats	Auto-déclaré
EgoSchema	71,5 %	5ᵉ / 9	llm-stats	Auto-déclaré
MMMU	70,7 %	27ᵉ / 61	llm-stats	Auto-déclaré
MRCR	69,2 %	4ᵉ / 7	llm-stats	Auto-déclaré
HiddenMath	63,0 %	1ᵉ / 13	llm-stats	Auto-déclaré
GPQA	62,1 %	137ᵉ / 213	llm-stats	Auto-déclaré
Bird-SQL (dev)	56,9 %	2ᵉ / 7	llm-stats	Auto-déclaré
Vibe-Eval	56,3 %	4ᵉ / 8	llm-stats	Auto-déclaré
CoVoST2	39,2 %	2ᵉ / 4	llm-stats	Auto-déclaré
LiveCodeBench	35,1 %	52ᵉ / 72	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

Claude Fable 559.9

GPT-5.451.4

Gemini 3.1 Pro Preview46.5

Llama 4 Maverick14.3

▶ Gemini 2.0 Flash12.3

Math Index

GPT-5 Codex98.7

gemini-3-flash97.0

DeepSeek V3.292.0

Qwen3-235B-A22B-Instruc…71.7

▶ Gemini 2.0 Flash21.7

Llama 4 Maverick19.3

Tarifs

Fournisseur	Entrée / 1M	Sortie / 1M	Cache lecture / 1M
artificialanalysis	0,15 $	0,6 $	0,025 $

Prix en dollars US par million de tokens.

Sa tarification se situe 92 % en dessous de la moyenne des LLM similaires, et 32,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. Gemini 2.0 Flash se distingue d’abord par sa fenêtre de contexte de 1 048 576 tokens, un format adapté aux entrées très longues à son époque. À sa sortie, il figurait dans le top 11% des LLM de sa génération sur GPQA diamond, un benchmark de questions scientifiques niveau doctorat, ce qui situait ses capacités de raisonnement scientifique dans le haut du panier de sa période. Sur MATH level 5, il affiche aussi un résultat solide, davantage favorable que ses indices globaux ne le suggèrent. Son autre force majeure reste le coût : la tarification est très économique, 92% sous la moyenne des LLM similaires et environ 32,2 fois inférieure à celle des modèles frontière.

Limites et points d’attention. Son ancienneté pèse fortement : un modèle sorti début 2025 est probablement largement dépassé aujourd’hui, et ce type de génération est souvent retiré du catalogue de l’éditeur. Les classements globaux le placent bas sur l’Intelligence Index et en retrait sur le Math Index. Les résultats deviennent faibles sur OTIS Mock AIME, puis très faibles sur FrontierMath, qui mesure des mathématiques de recherche très difficiles. Les connaissances s’arrêtent au 2024-08-01, et la licence propriétaire limite l’audit ou l’hébergement indépendant.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Epoch AI (epoch.ai), CC-BY-4.0.

Gemini 2.0 Flash

Caractéristiques

Indices de synthèse

Performances (benchmarks)

Comment se situe-t-il ?

Tarifs

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast