DiffusionGemma 26B-A4B

DiffusionGemma 26B-A4B est un LLM de Google publié le 10 juin 2026, avec 25 milliards de paramètres et des connaissances arrêtées au 1er janvier 2025. Son positionnement le place dans la génération de modèles sortis autour de 2026, avec une évaluation disponible sur GPQA pour situer son…

DiffusionGemma 26B-A4B est un LLM de Google publié le 10 juin 2026, avec 25 milliards de paramètres et des connaissances arrêtées au 1er janvier 2025. Son positionnement le place dans la génération de modèles sortis autour de 2026, avec une évaluation disponible sur GPQA pour situer son niveau à sa sortie.

Le modèle est distribué en open-weights sous licence Apache 2.0, avec usage commercial autorisé. Cette combinaison en fait un modèle exploitable hors d’une API propriétaire, tout en restant rattaché à un éditeur majeur de l’IA.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurGoogle
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie10 juin 2026
Connaissances jusqu'à2025-01-01
Multimodaloui
Paramètres25 milliards

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MMMLU81,5 %37ᵉ / 49llm-statsAuto-déclaré
MMLU-Pro77,6 %60ᵉ / 125llm-statsAuto-déclaré
GPQA73,2 %102ᵉ / 213llm-statsAuto-déclaré
MathVision70,5 %15ᵉ / 31llm-statsAuto-déclaré
AIME 202669,1 %15ᵉ / 17llm-statsAuto-déclaré
LiveCodeBench v669,1 %31ᵉ / 53llm-statsAuto-déclaré
t2-bench56,2 %20ᵉ / 23llm-statsAuto-déclaré
MMMU-Pro54,3 %49ᵉ / 60llm-statsAuto-déclaré
MedXpertQA49,0 %7ᵉ / 12llm-statsAuto-déclaré
CodeForces47,6 %16ᵉ / 16llm-statsAuto-déclaré
BIG-Bench Extra Hard47,6 %4ᵉ / 11llm-statsAuto-déclaré
MRCR v232,0 %5ᵉ / 8llm-statsAuto-déclaré
Humanity's Last Exam11,9 %72ᵉ / 86llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. DiffusionGemma 26B-A4B combine un éditeur de premier plan, Google, une licence Apache 2.0 et des poids ouverts, ce qui autorise des usages commerciaux et des déploiements indépendants d’un service fermé. À sa sortie, il se situait dans le top 58% des LLM de sa génération sur GPQA, un benchmark utilisé pour mesurer le raisonnement sur des questions difficiles. Ce résultat ne le place pas parmi les tout premiers modèles de sa période, mais il donne un repère concret sur son niveau comparatif au moment de sa publication.

Limites et points d'attention. La fiche repose sur une seule source de données concordante, ce qui limite la profondeur de validation publique disponible. Les connaissances du modèle s’arrêtent au 1er janvier 2025, un point important pour les usages liés à l’actualité, aux produits récents ou aux informations postérieures. Son classement GPQA indique un positionnement intermédiaire à sa sortie plutôt qu’un statut de modèle haut de gamme. Le profil convient surtout à l’évaluation d’un LLM open-weights récent de Google, lorsque la licence Apache 2.0 et l’usage commercial autorisé sont des critères centraux.


Sources des données : LLM-Stats (llm-stats.com).