Gemini 1.5 Flash 8B

Gemini 1.5 Flash 8B est un LLM propriétaire de Google, lancé le 15 mars 2024, avec des poids non ouverts. Son profil combine un format relativement compact, 8 milliards de paramètres, et une très grande fenêtre de contexte d’environ 1,0 M de tokens.

Gemini 1.5 Flash 8B est un LLM propriétaire de Google, lancé le 15 mars 2024, avec des poids non ouverts. Son profil combine un format relativement compact, 8 milliards de paramètres, et une très grande fenêtre de contexte d’environ 1,0 M de tokens.

Avec près de deux ans d’ancienneté, il appartient déjà à une génération longue à l’échelle de l’IA. La fiche sert surtout à situer ce modèle dans son époque, car ses performances sont probablement dépassées et il est souvent retiré du catalogue de l’éditeur aujourd’hui.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurGoogle
LicenceProprietary (poids non ouverts)
Date de sortie15 mars 2024
Connaissances jusqu'à2024-10-01
Multimodaloui
Paramètres8 milliards
Fenêtre de contexte1 048 576 tokens (≈ 1,0 M)
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: GPQA diamond33,0 %114ᵉ / 132epoch✅ Mesuré
Epoch: OTIS Mock AIME 2024-20254,6 %93ᵉ / 111epoch✅ Mesuré
XSTest92,6 %3ᵉ / 3llm-statsAuto-déclaré
FLEURS86,4 %6ᵉ / 6llm-statsAuto-déclaré
Natural2Code75,5 %6ᵉ / 8llm-statsAuto-déclaré
WMT2372,6 %3ᵉ / 4llm-statsAuto-déclaré
Video-MME66,2 %16ᵉ / 17llm-statsAuto-déclaré
MATH58,7 %49ᵉ / 70llm-statsAuto-déclaré
MMLU-Pro58,7 %101ᵉ / 125llm-statsAuto-déclaré
MathVista54,7 %31ᵉ / 38llm-statsAuto-déclaré
MRCR54,7 %5ᵉ / 7llm-statsAuto-déclaré
MMMU53,7 %51ᵉ / 61llm-statsAuto-déclaré
Vibe-Eval40,9 %8ᵉ / 8llm-statsAuto-déclaré
GPQA38,4 %187ᵉ / 213llm-statsAuto-déclaré
HiddenMath32,8 %10ᵉ / 13llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: GPQA diamond

GPT-5.4 Pro95 %
Gemini 3.1 Pro Preview94 %
Qwen3.7 Max92 %
Phi 456 %
▶ Gemini 1.5 Flash 8B33 %

Epoch: OTIS Mock AIME 2024-2025

GPT-5.5100 %
Phi 414 %
▶ Gemini 1.5 Flash 8B5 %

Notre analyse

Forces. Gemini 1.5 Flash 8B se distingue d’abord par sa fenêtre de contexte très étendue, rare pour un modèle de 8 milliards de paramètres dans sa période de sortie. À son lancement, il se situait dans le top 57% des LLM de sa génération sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat. Cette position indique un modèle exploitable dans le paysage de 2024, sans appartenir au haut du panier. Sa base de connaissances annoncée jusqu’au 2024-10-01 prolonge aussi sa pertinence documentaire par rapport à sa date de lancement initiale.

Limites et points d'attention. Les résultats disponibles montrent des limites nettes en raisonnement avancé. Sur GPQA diamond, le modèle reste en bas de classement global, et son score sur OTIS Mock AIME 2024-2025, centré sur des olympiades de mathématiques de niveau lycée, signale une faiblesse marquée en mathématiques exigeantes. Son ancienneté pèse fortement : à l’échelle actuelle, ses performances sont largement dépassées, et ce type de modèle est souvent retiré des catalogues d’éditeurs. La licence propriétaire limite aussi l’audit indépendant et la réutilisation directe des poids. La couverture repose toutefois sur 3 sources concordantes, ce qui rend son positionnement historique relativement solide.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.