Sarvam-30B

Sarvam-30B est un LLM de 30 milliards de paramètres publié par sarvamai le 6 mars 2026. Le modèle se distingue d’abord par son format open-weights sous licence Apache 2.0, avec usage commercial autorisé.

Sarvam-30B est un LLM de 30 milliards de paramètres publié par sarvamai le 6 mars 2026. Le modèle se distingue d’abord par son format open-weights sous licence Apache 2.0, avec usage commercial autorisé.

À sa sortie, Sarvam-30B se situait dans le top 62% sur GPQA parmi 169 LLM de sa génération, un repère qui le place dans le milieu du marché de l’époque plutôt que parmi les modèles les plus performants.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
Éditeursarvamai
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie6 mars 2026
Multimodalnon
Paramètres30 milliards

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MATH-50097,0 %8ᵉ / 31llm-statsAuto-déclaré
AIME 202596,7 %14ᵉ / 108llm-statsAuto-déclaré
MBPP92,7 %1ᵉ / 33llm-statsAuto-déclaré
HumanEval92,1 %8ᵉ / 65llm-statsAuto-déclaré
MMLU85,1 %41ᵉ / 98llm-statsAuto-déclaré
MMLU-Pro80,0 %53ᵉ / 125llm-statsAuto-déclaré
HMMT2574,2 %15ᵉ / 25llm-statsAuto-déclaré
HMMT 202573,3 %28ᵉ / 33llm-statsAuto-déclaré
LiveCodeBench v670,0 %30ᵉ / 53llm-statsAuto-déclaré
GPQA66,5 %125ᵉ / 213llm-statsAuto-déclaré
Beyond AIME58,3 %5ᵉ / 5llm-statsAuto-déclaré
Arena-Hard v249,0 %15ᵉ / 16llm-statsAuto-déclaré
BrowseComp35,5 %46ᵉ / 51llm-statsAuto-déclaré
SWE-Bench Verified34,0 %94ᵉ / 100llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Sarvam-30B combine une taille intermédiaire, 30 milliards de paramètres, avec une licence permissive adaptée aux déploiements commerciaux et aux usages nécessitant des poids ouverts. Son principal intérêt tient à cette combinaison entre accessibilité juridique et modèle généraliste récent. Sur GPQA, un benchmark centré sur des questions difficiles de raisonnement scientifique, il figurait à sa sortie dans le top 62% des LLM comparables publiés sur les 18 mois précédents, ce qui indique un niveau mesurable mais non dominant dans sa génération.

Limites et points d'attention. Le seul repère de performance disponible ici est GPQA, ce qui empêche de qualifier ses capacités en code, en agents, en mathématiques avancées ou en préférences utilisateur. La couverture repose sur 1 source de données concordante, un niveau d’information limité pour juger finement sa robustesse. Sarvam-30B convient surtout aux contextes où les poids ouverts, la licence Apache 2.0 et l’usage commercial priment sur la recherche d’un modèle haut de gamme.


Sources des données : LLM-Stats (llm-stats.com).