Gemini 2.0 Flash Experimental
Gemini 2.0 Flash Experimental est un LLM expérimental de Google, sorti le 21 janvier 2025. Avec environ un an d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, où les cycles de remplacement sont rapides.
Gemini 2.0 Flash Experimental est un LLM expérimental de Google, sorti le 21 janvier 2025. Avec environ un an d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, où les cycles de remplacement sont rapides.
Son principal trait distinctif est sa très grande fenêtre de contexte, proche de 1,0 M de tokens, associée à des connaissances arrêtées au 31 août 2024. À sa sortie, il se situait dans le haut du panier de sa génération sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | |
| Date de sortie | 21 janvier 2025 |
| Connaissances jusqu'à | 2024-08-31 |
| Multimodal | oui |
| Fenêtre de contexte | 1 048 576 tokens (≈ 1,0 M) |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: OTIS Mock AIME 2024-2025 | 57,8 % | 57ᵉ / 111 | epoch | ✅ Mesuré |
| Epoch: GPQA diamond | 57,1 % | 70ᵉ / 132 | epoch | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Epoch: OTIS Mock AIME 2024-2025
Epoch: GPQA diamond
Classements Arena (Elo)
| Catégorie | Elo | Rang |
|---|---|---|
| text-to-image | 945 | 133ᵉ |
Notre analyse
Forces. Gemini 2.0 Flash Experimental se distingue surtout par sa capacité à traiter de longs contextes, un atout pour analyser de grands volumes de texte dans un seul échange. Sur GPQA diamond, il figurait à sa sortie dans le top 16% des LLM de sa période, ce qui indique un niveau solide sur les questions scientifiques complexes par rapport aux modèles contemporains. Ses résultats sur OTIS Mock AIME 2024-2025, centré sur des olympiades de mathématiques de niveau lycée, le placent plutôt dans une zone intermédiaire, mais avec une performance exploitable pour le raisonnement mathématique exigeant de son époque.
Limites et points d'attention. Son âge pèse fortement dans l’évaluation actuelle : un modèle expérimental sorti début 2025 est probablement dépassé par les modèles haut de gamme plus récents, et ce type de version est souvent retiré ou remplacé dans les catalogues d’éditeurs. Ses connaissances s’arrêtent au 31 août 2024, ce qui limite sa pertinence sur les événements, produits et publications postérieurs. Le signal text-to-image est faible dans l’Arena text-to-image, où son classement le place loin des meilleurs systèmes évalués. La couverture repose toutefois sur 3 sources concordantes, ce qui donne une base de comparaison relativement stable pour situer ce modèle dans sa génération.
Sources des données : OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Epoch AI (epoch.ai), CC-BY-4.0.