Pixtral-12B

Pixtral-12B est un LLM de Mistral AI publié le 17 septembre 2024 sous licence Apache 2.0, avec des poids ouverts et un usage commercial autorisé. Son positionnement combine un format relativement compact, 12 milliards de paramètres, et une fenêtre de contexte très large de 128 000 tokens.

Pixtral-12B est un LLM de Mistral AI publié le 17 septembre 2024 sous licence Apache 2.0, avec des poids ouverts et un usage commercial autorisé. Son positionnement combine un format relativement compact, 12 milliards de paramètres, et une fenêtre de contexte très large de 128 000 tokens.

Avec environ deux ans d’ancienneté, Pixtral-12B appartient déjà à une génération ancienne à l’échelle de l’IA. La fiche sert donc surtout à situer un modèle open-weights important de sa période, plutôt qu’un système à comparer directement aux modèles haut de gamme actuels.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMistral AI
LicenceApache 2.0 (open-weights, usage commercial autorisé)
Date de sortie17 septembre 2024
Connaissances jusqu'à2024-06-30
Multimodaloui
Paramètres12 milliards
Fenêtre de contexte128 000 tokens
Modalités (entrée → sortie)text,image → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
DocVQA90,7 %18ᵉ / 26llm-statsAuto-déclaré
ChartQA81,8 %17ᵉ / 24llm-statsAuto-déclaré
VQAv278,6 %2ᵉ / 3llm-statsAuto-déclaré
MT-Bench76,8 %11ᵉ / 12llm-statsAuto-déclaré
HumanEval72,0 %54ᵉ / 65llm-statsAuto-déclaré
MMLU69,2 %84ᵉ / 98llm-statsAuto-déclaré
IFEval61,3 %64ᵉ / 65llm-statsAuto-déclaré
MM-MT-Bench60,5 %4ᵉ / 17llm-statsAuto-déclaré
MathVista58,0 %27ᵉ / 38llm-statsAuto-déclaré
MMMU52,5 %54ᵉ / 61llm-statsAuto-déclaré
MATH48,1 %57ᵉ / 70llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Pixtral-12B se plaçait dans la partie supérieure des LLM de sa génération sur MATH, un benchmark centré sur les capacités mathématiques, parmi 36 modèles comparables publiés dans une fenêtre de temps proche. Sa fenêtre de contexte de 128 000 tokens constituait aussi un atout concret pour traiter de longs documents, de grands historiques de conversation ou des corpus volumineux sans découpage excessif. Sa licence Apache 2.0, associée à des poids ouverts et à l’usage commercial autorisé, en faisait un modèle exploitable hors API propriétaire, avec davantage de contrôle sur le déploiement.

Limites et points d'attention. Pixtral-12B doit être lu comme un modèle de 2024 : ses performances sont aujourd’hui largement dépassées par les générations plus récentes, et un modèle de cet âge est souvent retiré du catalogue actif de son éditeur. Sa coupure de connaissances au 30 juin 2024 limite aussi son intérêt pour les contenus récents. Les faits disponibles ne fournissent pas de chiffres vérifiés sur le coût d’entraînement ou l’équivalent en GPU H100, ce qui empêche d’évaluer précisément l’effort industriel derrière le modèle. La couverture repose sur deux sources concordantes, suffisante pour établir les principaux repères, mais limitée pour documenter finement ses performances au-delà des éléments listés.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).