Jamba 1.5 Mini

Jamba 1.5 Mini est la version compacte de la famille Jamba d'AI21 Labs, sortie le 22 août 2024 aux côtés de la Large. Elle reprend la même architecture hybride Mamba-Transformer avec Mixture-of-Experts, à échelle réduite : 52 milliards de paramètres au total, 12 actifs. L'objectif est…

Jamba 1.5 Mini est la version compacte de la famille Jamba d'AI21 Labs, sortie le 22 août 2024 aux côtés de la Large. Elle reprend la même architecture hybride Mamba-Transformer avec Mixture-of-Experts, à échelle réduite : 52 milliards de paramètres au total, 12 actifs. L'objectif est d'offrir un très long contexte (256 000 tokens) à basse latence et à coût dérisoire.

Distribuée en poids ouverts (licence AI21) et via API à un tarif très agressif, elle visait à être le modèle ouvert le plus performant de sa catégorie de taille. Comme la Large, elle appartient à une génération aujourd'hui remplacée par Jamba 1.6 et 1.7.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurAI21
LicenceJamba Open Model License (poids non ouverts)
Date de sortie22 août 2024
Connaissances jusqu'à2024-03-05
Multimodalnon
Paramètres52 milliards
Paramètres actifs12 milliards
Fenêtre de contexte256 144 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
ARC-C85,7 %13ᵉ / 34llm-statsAuto-déclaré
GSM8k75,8 %40ᵉ / 47llm-statsAuto-déclaré
MMLU69,7 %82ᵉ / 98llm-statsAuto-déclaré
TruthfulQA54,1 %15ᵉ / 18llm-statsAuto-déclaré
Arena Hard46,1 %20ᵉ / 26llm-statsAuto-déclaré
MMLU-Pro42,5 %119ᵉ / 125llm-statsAuto-déclaré
Wild Bench42,4 %8ᵉ / 8llm-statsAuto-déclaré
GPQA32,3 %199ᵉ / 213llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Le rapport coût/contexte est sa vraie signature : 256K tokens réellement tenus (RULER) pour un prix d'API parmi les plus bas du marché, et l'une des latences les plus faibles de sa classe grâce aux couches Mamba. À sa sortie, elle dominait sa catégorie de modèles ouverts sur le suivi d'instructions (Arena Hard), devant Mixtral 8x22B et Command-R+, tout en restant déployable sur un seul GPU avec quantification. Elle hérite des fonctions entreprise de la Large (function calling, sorties structurées).

Limites et points d'attention. Comme sa grande sœur, elle est texte seul et plafonne vite sur le raisonnement difficile (GPQA au niveau du hasard). Sa connaissance s'arrête en mars 2024 et elle appartient à une génération dépréciée, dépassée par les petits modèles ouverts plus récents. Son intérêt aujourd'hui est de montrer qu'un petit modèle ouvert pouvait, dès 2024, offrir un contexte de 256K réellement utilisable.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).