Google

Gemini 2.0 Flash Experimental

Gemini 2.0 Flash Experimental est un LLM expérimental de Google, sorti le 21 janvier 2025. Avec environ un an d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, où les cycles de remplacement sont rapides.

Son principal trait distinctif est sa très grande fenêtre de contexte, proche de 1,0 M de tokens, associée à des connaissances arrêtées au 31 août 2024. À sa sortie, il se situait dans le haut du panier de sa génération sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Google
Date de sortie	21 janvier 2025
Connaissances jusqu'à	2024-08-31
Multimodal	oui
Fenêtre de contexte	1 048 576 tokens (≈ 1,0 M)
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
Epoch: OTIS Mock AIME 2024-2025	57,8 %	57ᵉ / 111	epoch	✅ Mesuré
Epoch: GPQA diamond	57,1 %	70ᵉ / 132	epoch	✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: OTIS Mock AIME 2024-2025

GPT-5.5100 %

Claude Fable 5100 %

DeepSeek V4 Pro97 %

Muse Spark89 %

▶ Gemini 2.0 Flash Experi…58 %

Mistral Medium…32 %

Epoch: GPQA diamond

GPT-5.4 Pro95 %

Gemini 3.1 Pro Preview94 %

Qwen3.7 Max92 %

Mistral Medium…60 %

▶ Gemini 2.0 Flash Experi…57 %

Phi 456 %

Classements Arena (Elo)

Catégorie	Elo	Rang
text-to-image	945	133ᵉ

Notre analyse

Forces. Gemini 2.0 Flash Experimental se distingue surtout par sa capacité à traiter de longs contextes, un atout pour analyser de grands volumes de texte dans un seul échange. Sur GPQA diamond, il figurait à sa sortie dans le top 16% des LLM de sa période, ce qui indique un niveau solide sur les questions scientifiques complexes par rapport aux modèles contemporains. Ses résultats sur OTIS Mock AIME 2024-2025, centré sur des olympiades de mathématiques de niveau lycée, le placent plutôt dans une zone intermédiaire, mais avec une performance exploitable pour le raisonnement mathématique exigeant de son époque.

Limites et points d'attention. Son âge pèse fortement dans l’évaluation actuelle : un modèle expérimental sorti début 2025 est probablement dépassé par les modèles haut de gamme plus récents, et ce type de version est souvent retiré ou remplacé dans les catalogues d’éditeurs. Ses connaissances s’arrêtent au 31 août 2024, ce qui limite sa pertinence sur les événements, produits et publications postérieurs. Le signal text-to-image est faible dans l’Arena text-to-image, où son classement le place loin des meilleurs systèmes évalués. La couverture repose toutefois sur 3 sources concordantes, ce qui donne une base de comparaison relativement stable pour situer ce modèle dans sa génération.

Sources des données : OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Epoch AI (epoch.ai), CC-BY-4.0.

Gemini 2.0 Flash Experimental

Caractéristiques

Performances (benchmarks)

Comment se situe-t-il ?

Classements Arena (Elo)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast