Gemini 2.0 Flash
Gemini 2.0 Flash est un LLM propriétaire de Google, sorti le 21 janvier 2025, avec des poids non ouverts. À environ un an d’ancienneté, il appartient déjà à une génération longue à l’échelle de l’IA, à analyser surtout par rapport aux modèles disponibles au moment de son lancement.
Gemini 2.0 Flash est un LLM propriétaire de Google, sorti le 21 janvier 2025, avec des poids non ouverts. À environ un an d’ancienneté, il appartient déjà à une génération longue à l’échelle de l’IA, à analyser surtout par rapport aux modèles disponibles au moment de son lancement.
Son profil combine une très grande fenêtre de contexte, proche de 1,0 M de tokens, et un positionnement tarifaire très économique. Son prix est nettement inférieur à la moyenne des LLM similaires et reste très en dessous des modèles frontière, ce qui en faisait un modèle Flash orienté volume et coût maîtrisé.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | |
| Licence | Proprietary (poids non ouverts) |
| Date de sortie | 21 janvier 2025 |
| Connaissances jusqu'à | 2024-08-01 |
| Multimodal | oui |
| Fenêtre de contexte | 1 048 576 tokens (≈ 1,0 M) |
| Modalités (entrée → sortie) | text,image → text |
Indices de synthèse
| Indice | Valeur | Rang (LLM) |
|---|---|---|
| Intelligence Index | 12.3 | 120ᵉ / 136 |
| Math Index | 21.7 | 44ᵉ / 55 |
Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: MATH level 5 | 82,2 % | 24ᵉ / 84 | epoch | ✅ Mesuré |
| Epoch: GPQA diamond | 64,1 % | 66ᵉ / 132 | epoch | ✅ Mesuré |
| Epoch: OTIS Mock AIME 2024-2025 | 31,1 % | 67ᵉ / 111 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-2025-02-28-Private | 1,7 % | 56ᵉ / 69 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-2025-02-28-Public | 0,0 % | 35ᵉ / 64 | epoch | ✅ Mesuré |
| Natural2Code | 92,9 % | 1ᵉ / 8 | llm-stats | Auto-déclaré |
| MATH | 89,7 % | 5ᵉ / 70 | llm-stats | Auto-déclaré |
| FACTS Grounding | 83,6 % | 4ᵉ / 13 | llm-stats | Auto-déclaré |
| MMLU-Pro | 76,4 % | 64ᵉ / 125 | llm-stats | Auto-déclaré |
| AIME 2024 | 73,3 % | 36ᵉ / 52 | llm-stats | Auto-déclaré |
| EgoSchema | 71,5 % | 5ᵉ / 9 | llm-stats | Auto-déclaré |
| MMMU | 70,7 % | 27ᵉ / 61 | llm-stats | Auto-déclaré |
| MRCR | 69,2 % | 4ᵉ / 7 | llm-stats | Auto-déclaré |
| HiddenMath | 63,0 % | 1ᵉ / 13 | llm-stats | Auto-déclaré |
| GPQA | 62,1 % | 137ᵉ / 213 | llm-stats | Auto-déclaré |
| Bird-SQL (dev) | 56,9 % | 2ᵉ / 7 | llm-stats | Auto-déclaré |
| Vibe-Eval | 56,3 % | 4ᵉ / 8 | llm-stats | Auto-déclaré |
| CoVoST2 | 39,2 % | 2ᵉ / 4 | llm-stats | Auto-déclaré |
| LiveCodeBench | 35,1 % | 52ᵉ / 72 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Intelligence Index
Math Index
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| artificialanalysis | 0,15 $ | 0,6 $ | 0,025 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 92 % en dessous de la moyenne des LLM similaires, et 32,2 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Notre analyse
Forces. Gemini 2.0 Flash se distingue d’abord par sa fenêtre de contexte de 1 048 576 tokens, un format adapté aux entrées très longues à son époque. À sa sortie, il figurait dans le top 11% des LLM de sa génération sur GPQA diamond, un benchmark de questions scientifiques niveau doctorat, ce qui situait ses capacités de raisonnement scientifique dans le haut du panier de sa période. Sur MATH level 5, il affiche aussi un résultat solide, davantage favorable que ses indices globaux ne le suggèrent. Son autre force majeure reste le coût : la tarification est très économique, 92% sous la moyenne des LLM similaires et environ 32,2 fois inférieure à celle des modèles frontière.
Limites et points d’attention. Son ancienneté pèse fortement : un modèle sorti début 2025 est probablement largement dépassé aujourd’hui, et ce type de génération est souvent retiré du catalogue de l’éditeur. Les classements globaux le placent bas sur l’Intelligence Index et en retrait sur le Math Index. Les résultats deviennent faibles sur OTIS Mock AIME, puis très faibles sur FrontierMath, qui mesure des mathématiques de recherche très difficiles. Les connaissances s’arrêtent au 2024-08-01, et la licence propriétaire limite l’audit ou l’hébergement indépendant.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Epoch AI (epoch.ai), CC-BY-4.0.