Google

DiffusionGemma 26B-A4B

DiffusionGemma 26B-A4B est un LLM de Google publié le 10 juin 2026, avec 25 milliards de paramètres et des connaissances arrêtées au 1er janvier 2025. Son positionnement le place dans la génération de modèles sortis autour de 2026, avec une évaluation disponible sur GPQA pour situer son…

Le modèle est distribué en open-weights sous licence Apache 2.0, avec usage commercial autorisé. Cette combinaison en fait un modèle exploitable hors d’une API propriétaire, tout en restant rattaché à un éditeur majeur de l’IA.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Google
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	10 juin 2026
Connaissances jusqu'à	2025-01-01
Multimodal	oui
Paramètres	25 milliards

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
MMMLU	81,5 %	37ᵉ / 49	llm-stats	Auto-déclaré
MMLU-Pro	77,6 %	60ᵉ / 125	llm-stats	Auto-déclaré
GPQA	73,2 %	102ᵉ / 213	llm-stats	Auto-déclaré
MathVision	70,5 %	15ᵉ / 31	llm-stats	Auto-déclaré
AIME 2026	69,1 %	15ᵉ / 17	llm-stats	Auto-déclaré
LiveCodeBench v6	69,1 %	31ᵉ / 53	llm-stats	Auto-déclaré
t2-bench	56,2 %	20ᵉ / 23	llm-stats	Auto-déclaré
MMMU-Pro	54,3 %	49ᵉ / 60	llm-stats	Auto-déclaré
MedXpertQA	49,0 %	7ᵉ / 12	llm-stats	Auto-déclaré
CodeForces	47,6 %	16ᵉ / 16	llm-stats	Auto-déclaré
BIG-Bench Extra Hard	47,6 %	4ᵉ / 11	llm-stats	Auto-déclaré
MRCR v2	32,0 %	5ᵉ / 8	llm-stats	Auto-déclaré
Humanity's Last Exam	11,9 %	72ᵉ / 86	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. DiffusionGemma 26B-A4B combine un éditeur de premier plan, Google, une licence Apache 2.0 et des poids ouverts, ce qui autorise des usages commerciaux et des déploiements indépendants d’un service fermé. À sa sortie, il se situait dans le top 58% des LLM de sa génération sur GPQA, un benchmark utilisé pour mesurer le raisonnement sur des questions difficiles. Ce résultat ne le place pas parmi les tout premiers modèles de sa période, mais il donne un repère concret sur son niveau comparatif au moment de sa publication.

Limites et points d'attention. La fiche repose sur une seule source de données concordante, ce qui limite la profondeur de validation publique disponible. Les connaissances du modèle s’arrêtent au 1er janvier 2025, un point important pour les usages liés à l’actualité, aux produits récents ou aux informations postérieures. Son classement GPQA indique un positionnement intermédiaire à sa sortie plutôt qu’un statut de modèle haut de gamme. Le profil convient surtout à l’évaluation d’un LLM open-weights récent de Google, lorsque la licence Apache 2.0 et l’usage commercial autorisé sont des critères centraux.

Sources des données : LLM-Stats (llm-stats.com).

DiffusionGemma 26B-A4B

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast