Gemini 1.5 Pro

Gemini 1.5 Pro est un LLM propriétaire de Google, publié le 1 mai 2024 aux États-Unis, avec des poids non ouverts. À l’échelle de l’IA, son ancienneté d’environ deux ans le rattache déjà à une génération passée, à comparer d’abord aux modèles de sa période plutôt qu’aux modèles haut de…

Gemini 1.5 Pro est un LLM propriétaire de Google, publié le 1 mai 2024 aux États-Unis, avec des poids non ouverts. À l’échelle de l’IA, son ancienneté d’environ deux ans le rattache déjà à une génération passée, à comparer d’abord aux modèles de sa période plutôt qu’aux modèles haut de gamme récents.

Son trait le plus distinctif reste sa fenêtre de contexte de 2 097 152 tokens, soit environ 2,1 M, très élevée pour un modèle de cette génération. Ses connaissances s’arrêtent au 1 novembre 2023, ce qui fixe clairement son périmètre d’usage documentaire.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurGoogle
LicenceProprietary (poids non ouverts)
Date de sortie1 mai 2024
Connaissances jusqu'à2023-11-01
Multimodaloui
Fenêtre de contexte2 097 152 tokens (≈ 2,1 M)
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: MATH level 570,4 %31ᵉ / 84epoch✅ Mesuré
Epoch: GPQA diamond57,2 %69ᵉ / 132epoch✅ Mesuré
Epoch: OTIS Mock AIME 2024-202523,1 %71ᵉ / 111epoch✅ Mesuré
XSTest98,8 %1ᵉ / 3llm-statsAuto-déclaré
FLEURS93,3 %3ᵉ / 6llm-statsAuto-déclaré
HellaSwag93,3 %3ᵉ / 27llm-statsAuto-déclaré
GSM8k90,8 %25ᵉ / 47llm-statsAuto-déclaré
BIG-Bench Hard89,2 %2ᵉ / 20llm-statsAuto-déclaré
MGSM87,5 %11ᵉ / 30llm-statsAuto-déclaré
MATH86,5 %10ᵉ / 70llm-statsAuto-déclaré
MMLU85,9 %33ᵉ / 98llm-statsAuto-déclaré
Natural2Code85,4 %2ᵉ / 8llm-statsAuto-déclaré
HumanEval84,1 %38ᵉ / 65llm-statsAuto-déclaré
MRCR82,6 %2ᵉ / 7llm-statsAuto-déclaré
Video-MME78,6 %9ᵉ / 17llm-statsAuto-déclaré
MMLU-Pro75,8 %67ᵉ / 125llm-statsAuto-déclaré
WMT2375,1 %1ᵉ / 4llm-statsAuto-déclaré
DROP74,9 %19ᵉ / 29llm-statsAuto-déclaré
MathVista68,1 %17ᵉ / 38llm-statsAuto-déclaré
MMMU65,9 %36ᵉ / 61llm-statsAuto-déclaré
GPQA59,1 %141ᵉ / 213llm-statsAuto-déclaré
Vibe-Eval53,9 %5ᵉ / 8llm-statsAuto-déclaré
HiddenMath52,0 %5ᵉ / 13llm-statsAuto-déclaré
AMC_2022_2346,4 %5ᵉ / 6llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: MATH level 5

GPT-598 %
Qwen3-Max-Instruct97 %
Llama 4 Maverick73 %
▶ Gemini 1.5 Pro70 %
Phi 465 %

Epoch: GPQA diamond

GPT-5.4 Pro95 %
Gemini 3.1 Pro Preview94 %
Qwen3.7 Max92 %
Mistral Medium…60 %
▶ Gemini 1.5 Pro57 %
Phi 456 %

Entraînement & empreinte

IndicateurValeur
Jeu de donnéesUnspecified unreleased
MatérielGoogle TPU v4
PaysUnited States of America

Notre analyse

Forces. À sa sortie, Gemini 1.5 Pro figurait dans le top 4% des LLM de sa génération sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat. Ce positionnement indique un modèle particulièrement compétitif, pour son époque, sur le raisonnement scientifique exigeant. Sur MATH level 5, il se situe dans la partie supérieure du classement disponible, ce qui traduit des capacités mathématiques solides sans en faire un modèle dominant. Sa très grande fenêtre de contexte constitue son autre avantage majeur, car elle autorise le traitement de volumes de texte très importants dans une seule requête.

Limites et points d’attention. Gemini 1.5 Pro est aujourd’hui un modèle ancien à l’échelle du secteur, avec des performances largement dépassées par les modèles frontière récents et un statut probablement moins central, voire souvent retiré du catalogue de l’éditeur. Son résultat sur OTIS Mock AIME 2024-2025 signale une faiblesse nette sur les problèmes d’olympiades mathématiques de niveau lycée. Sur GPQA diamond, son rang global le place désormais loin des meilleurs modèles recensés. La licence propriétaire et les poids non ouverts limitent aussi l’audit indépendant du modèle, tandis que l’arrêt des connaissances à novembre 2023 réduit sa pertinence sur les événements et publications postérieurs.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Epoch AI (epoch.ai), CC-BY-4.0.