Gemini Diffusion

Gemini Diffusion est un LLM propriétaire de Google, publié le 20 mai 2025, avec des poids non ouverts. Avec environ un an d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, où les cycles de remplacement sont très rapides.

Gemini Diffusion est un LLM propriétaire de Google, publié le 20 mai 2025, avec des poids non ouverts. Avec environ un an d’ancienneté, il appartient déjà à une génération ancienne à l’échelle de l’IA, où les cycles de remplacement sont très rapides.

Son intérêt est surtout de situer une proposition Google dans le paysage des LLM de 2025. La comparaison pertinente se fait avec les modèles de sa période, car ses performances sont probablement dépassées par les modèles actuels et son maintien au catalogue actif n’est pas garanti.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurGoogle
LicenceProprietary (poids non ouverts)
Date de sortie20 mai 2025
Multimodalnon

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
HumanEval89,6 %14ᵉ / 65llm-statsAuto-déclaré
MBPP76,0 %17ᵉ / 33llm-statsAuto-déclaré
Global-MMLU-Lite69,1 %8ᵉ / 14llm-statsAuto-déclaré
GPQA40,4 %183ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench30,9 %60ᵉ / 72llm-statsAuto-déclaré
AIME 202523,3 %104ᵉ / 108llm-statsAuto-déclaré
SWE-Bench Verified22,9 %98ᵉ / 100llm-statsAuto-déclaré
BIG-Bench Extra Hard15,0 %9ᵉ / 11llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Gemini Diffusion n’était pas un modèle marginal dans sa génération : sur GPQA, il figurait dans le top 74% des 98 LLM comparables publiés dans une fenêtre de plus ou moins neuf mois. Ce positionnement indique un niveau exploitable sur ce benchmark à l’époque, sans le placer parmi les modèles les plus dominants de sa cohorte. Son rattachement à Google le situe aussi dans la famille des LLM propriétaires intégrés à un écosystème industriel, avec une distribution contrôlée plutôt qu’une diffusion ouverte des poids.

Limites et points d’attention. Le principal point faible est l’ancienneté : environ un an représente déjà un écart important dans l’IA générative, et le modèle doit être lu comme une référence de sa période plutôt que comme une option actuelle. Ses performances sont aujourd’hui probablement largement dépassées par les modèles haut de gamme plus récents. La licence propriétaire limite l’audit indépendant, la reproduction et l’hébergement autonome, puisque les poids ne sont pas ouverts. La couverture publique disponible est également réduite, avec une seule source de données concordante, ce qui restreint l’analyse au classement GPQA et aux informations de base connues.


Sources des données : LLM-Stats (llm-stats.com).