Gemini 2.5 Deep Think
Gemini 2.5 Deep Think est le mode de raisonnement étendu de Gemini 2.5 de Google, lancé publiquement le 1er août 2025. Ce n'est pas un modèle distinct mais une variante qui explore plusieurs pistes en parallèle (« parallel thinking ») avant de répondre, le premier système grand public…
Gemini 2.5 Deep Think est le mode de raisonnement étendu de Gemini 2.5 de Google, lancé publiquement le 1er août 2025. Ce n'est pas un modèle distinct mais une variante qui explore plusieurs pistes en parallèle (« parallel thinking ») avant de répondre, le premier système grand public multi-agents de Google. Il s'appuie sur Gemini 2.5 Pro, ses paramètres ne sont pas divulgués.
Il est réservé à l'abonnement Google AI Ultra (environ 250 dollars par mois) et à l'API pour testeurs. Détail important : la version publique est une déclinaison allégée, distincte du modèle « or » resté restreint.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Google,Google DeepMind |
| Date de sortie | 1 août 2025 |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| Epoch: FrontierMath-2025-02-28-Private | 29,0 % | 19ᵉ / 69 | epoch | ✅ Mesuré |
| Epoch: FrontierMath-Tier-4-2025-07-01-Private | 10,4 % | 20ᵉ / 55 | epoch | ✅ Mesuré |
Comment se situe-t-il ?
Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.
Epoch: FrontierMath-2025-02-28-Private
Epoch: FrontierMath-Tier-4-2025-07-01-Private
Entraînement & empreinte
| Indicateur | Valeur |
|---|---|
| Jeu de données | Unspecified unreleased |
| Pays | United States of America,United States of America |
Notre analyse
Forces. Ses résultats sur le raisonnement de très haut niveau sont marquants : médaille d'or à l'Olympiade internationale de mathématiques 2025 (35 points sur 42, cinq problèmes sur six résolus en langage naturel de bout en bout), niveau or également aux finales mondiales ICPC en programmation. Sur Humanity's Last Exam sans outils, il établissait un record au moment de sa sortie. La pensée parallèle apporte un gain réel sur les problèmes les plus durs.
Limites et points d'attention. L'accès est coûteux et limité (abonnement Ultra, pas de poids). La version réellement disponible n'est pas le modèle « or » de l'IMO, ce qui peut créer une confusion sur les capacités attendues. Le coût de calcul est élevé, et plusieurs variantes coexistent (or de l'IMO, ICPC, version publique allégée). Il s'adresse aux utilisateurs avancés confrontés à des problèmes de raisonnement exigeants.
Sources des données : Epoch AI (epoch.ai), CC-BY-4.0.