Gemini 2.5 Deep Think

Gemini 2.5 Deep Think est le mode de raisonnement étendu de Gemini 2.5 de Google, lancé publiquement le 1er août 2025. Ce n'est pas un modèle distinct mais une variante qui explore plusieurs pistes en parallèle (« parallel thinking ») avant de répondre, le premier système grand public…

Gemini 2.5 Deep Think est le mode de raisonnement étendu de Gemini 2.5 de Google, lancé publiquement le 1er août 2025. Ce n'est pas un modèle distinct mais une variante qui explore plusieurs pistes en parallèle (« parallel thinking ») avant de répondre, le premier système grand public multi-agents de Google. Il s'appuie sur Gemini 2.5 Pro, ses paramètres ne sont pas divulgués.

Il est réservé à l'abonnement Google AI Ultra (environ 250 dollars par mois) et à l'API pour testeurs. Détail important : la version publique est une déclinaison allégée, distincte du modèle « or » resté restreint.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurGoogle,Google DeepMind
Date de sortie1 août 2025

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: FrontierMath-2025-02-28-Private29,0 %19ᵉ / 69epoch✅ Mesuré
Epoch: FrontierMath-Tier-4-2025-07-01-Private10,4 %20ᵉ / 55epoch✅ Mesuré

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Epoch: FrontierMath-2025-02-28-Private

GPT-5.5 Pro52 %
Muse Spark39 %
Gemini 3.5 Flash39 %
▶ Gemini 2.5 Deep Think29 %
Qwen3.6 Plus26 %

Epoch: FrontierMath-Tier-4-2025-07-01-Private

GPT-5.5 Pro40 %
Gemini 3 Pro19 %
Muse Spark15 %
▶ Gemini 2.5 Deep Think10 %
Qwen3.6 Plus8 %

Entraînement & empreinte

IndicateurValeur
Jeu de donnéesUnspecified unreleased
PaysUnited States of America,United States of America

Notre analyse

Forces. Ses résultats sur le raisonnement de très haut niveau sont marquants : médaille d'or à l'Olympiade internationale de mathématiques 2025 (35 points sur 42, cinq problèmes sur six résolus en langage naturel de bout en bout), niveau or également aux finales mondiales ICPC en programmation. Sur Humanity's Last Exam sans outils, il établissait un record au moment de sa sortie. La pensée parallèle apporte un gain réel sur les problèmes les plus durs.

Limites et points d'attention. L'accès est coûteux et limité (abonnement Ultra, pas de poids). La version réellement disponible n'est pas le modèle « or » de l'IMO, ce qui peut créer une confusion sur les capacités attendues. Le coût de calcul est élevé, et plusieurs variantes coexistent (or de l'IMO, ICPC, version publique allégée). Il s'adresse aux utilisateurs avancés confrontés à des problèmes de raisonnement exigeants.


Sources des données : Epoch AI (epoch.ai), CC-BY-4.0.