Gemini 3 Pro

Gemini 3 Pro est un LLM propriétaire de Google, sorti le 18 novembre 2025, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte, d’environ 1,0 M de tokens, et un tarif classé économique pour sa catégorie.

Gemini 3 Pro est un LLM propriétaire de Google, sorti le 18 novembre 2025, avec des poids non ouverts. Son positionnement combine une très grande fenêtre de contexte, d’environ 1,0 M de tokens, et un tarif classé économique pour sa catégorie.

Le modèle se distingue surtout par ses résultats en raisonnement scientifique, en mathématiques difficiles et en réponses factuelles vérifiables. À sa sortie, il figurait dans le top 1% des LLM de sa génération sur GPQA diamond, un benchmark de questions scientifiques de niveau doctorat.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurGoogle
LicenceProprietary (poids non ouverts)
Date de sortie18 novembre 2025
Connaissances jusqu'à2025-01-31
Multimodaloui
Fenêtre de contexte1 048 576 tokens (≈ 1,0 M)
Modalités (entrée → sortie)text,image,audio,video → text

Indices de synthèse

IndiceValeurRang (LLM)
Intelligence Index39.625ᵉ / 136
Math Index95.74ᵉ / 55

Indices Artificial Analysis. Le rang situe le modèle parmi tous les LLM du catalogue disposant de l'indice.

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
Epoch: GPQA diamond92,6 %7ᵉ / 132epoch✅ Mesuré
Epoch: OTIS Mock AIME 2024-202591,4 %19ᵉ / 111epoch✅ Mesuré
Epoch: FrontierMath-2025-02-28-Public80,0 %6ᵉ / 64epoch✅ Mesuré
Epoch: SWE-Bench verified72,9 %21ᵉ / 32epoch✅ Mesuré
Epoch: SimpleQA Verified72,9 %2ᵉ / 52epoch✅ Mesuré
Epoch: FrontierMath-2025-02-28-Private37,6 %12ᵉ / 69epoch✅ Mesuré
Epoch: Chess Puzzles31,0 %13ᵉ / 43epoch✅ Mesuré
Epoch: FrontierMath-Tier-4-2025-07-01-Private18,8 %11ᵉ / 55epoch✅ Mesuré
Epoch: FrontierMath-Tier-4-2025-07-01-Public0,0 %3ᵉ / 36epoch✅ Mesuré
AIME 2025100,0 %1ᵉ / 108llm-statsAuto-déclaré
Global PIQA93,4 %1ᵉ / 13llm-statsAuto-déclaré
GPQA91,9 %10ᵉ / 213llm-statsAuto-déclaré
MMMLU91,8 %3ᵉ / 49llm-statsAuto-déclaré
VideoMMMU87,6 %1ᵉ / 26llm-statsAuto-déclaré
t2-bench85,4 %7ᵉ / 23llm-statsAuto-déclaré
CharXiv-R81,4 %13ᵉ / 42llm-statsAuto-déclaré
LiveCodeBench Pro81,3 %2ᵉ / 4llm-statsAuto-déclaré
MMMU-Pro81,0 %7ᵉ / 60llm-statsAuto-déclaré
SWE-Bench Verified76,2 %30ᵉ / 100llm-statsAuto-déclaré
LiveBench73,4 %21ᵉ / 38llm-statsn.d.
ScreenSpot Pro72,7 %5ᵉ / 23llm-statsAuto-déclaré
SimpleQA72,1 %6ᵉ / 45llm-statsAuto-déclaré
FACTS Grounding70,5 %8ᵉ / 13llm-statsAuto-déclaré
Terminal-Bench 2.054,2 %29ᵉ / 48llm-statsAuto-déclaré
Humanity's Last Exam45,8 %22ᵉ / 86llm-statsAuto-déclaré
ARC-AGI v231,1 %12ᵉ / 16llm-statsAuto-déclaré
MRCR v2 (8-needle)26,3 %7ᵉ / 10llm-statsAuto-déclaré
MathArena Apex23,4 %6ᵉ / 6llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Comment se situe-t-il ?

Le modèle (en orange) comparé aux meilleurs modèles « grand public » sur chaque dimension, et à ses voisins de classement.

Intelligence Index

GPT-5.451.4
Grok Build 0.1 061639.8
▶ Gemini 3 Pro39.6
Nemotron 3 Ultra 550B A…37.8

Math Index

GPT-5 Codex98.7
gemini-3-flash97.0
▶ Gemini 3 Pro95.7
DeepSeek V3.292.0

Classements Arena (Elo)

CatégorieEloRang
Arena Text14868ᵉ
Arena Image-to-Code145312ᵉ
Arena Code143929ᵉ
Arena Document143318ᵉ
Arena Vision12898ᵉ

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
artificialanalysis2 $12 $0,2 $

Prix en dollars US par million de tokens.

Sa tarification se situe 3 % au-dessus de la moyenne des LLM similaires, et 2,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Entraînement & empreinte

IndicateurValeur
Jeu de donnéesUnspecified unreleased
MatérielGoogle TPU v7 Ironwood
PaysUnited States of America

Notre analyse

Forces. Gemini 3 Pro apparaît particulièrement solide sur les tâches de raisonnement formel. Il se classe dans le top 10 sur Math Index, GPQA diamond et FrontierMath public, ce qui indique un niveau élevé sur les mathématiques avancées et les questions scientifiques exigeantes. SimpleQA Verified le place aussi parmi les meilleurs modèles évalués pour les réponses factuelles vérifiables. Sa fenêtre de contexte d’environ 1,0 M de tokens renforce son intérêt pour l’analyse de longs documents, de corpus techniques ou de bases de connaissances volumineuses. Côté coût, son tarif reste économique, légèrement au-dessus de la moyenne des LLM similaires, mais nettement inférieur à celui des modèles frontière.

Limites et points d'attention. Les performances en code sont moins marquantes que celles en science et en mathématiques : SWE-Bench verified et Arena code le placent plutôt en retrait par rapport à ses meilleurs classements. L’écart entre FrontierMath public et FrontierMath private signale aussi que la robustesse sur les problèmes mathématiques de recherche les plus difficiles n’est pas uniforme. Le modèle est propriétaire, avec des poids non ouverts, ce qui limite l’audit indépendant et l’hébergement autonome. Ses connaissances s’arrêtent au 2025-01-31, un point important pour les sujets récents. Gemini 3 Pro convient surtout aux usages nécessitant raisonnement scientifique, mathématiques avancées, vérification factuelle et traitement de très longs contextes à coût contenu.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai) · Artificial Analysis (artificialanalysis.ai) · Arena.ai (arena.ai) · Epoch AI (epoch.ai), CC-BY-4.0.