Mistral AI

Pixtral-12B

Pixtral-12B est un LLM de Mistral AI publié le 17 septembre 2024 sous licence Apache 2.0, avec des poids ouverts et un usage commercial autorisé. Son positionnement combine un format relativement compact, 12 milliards de paramètres, et une fenêtre de contexte très large de 128 000 tokens.

Avec environ deux ans d’ancienneté, Pixtral-12B appartient déjà à une génération ancienne à l’échelle de l’IA. La fiche sert donc surtout à situer un modèle open-weights important de sa période, plutôt qu’un système à comparer directement aux modèles haut de gamme actuels.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Mistral AI
Licence	Apache 2.0 (open-weights, usage commercial autorisé)
Date de sortie	17 septembre 2024
Connaissances jusqu'à	2024-06-30
Multimodal	oui
Paramètres	12 milliards
Fenêtre de contexte	128 000 tokens
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
DocVQA	90,7 %	18ᵉ / 26	llm-stats	Auto-déclaré
ChartQA	81,8 %	17ᵉ / 24	llm-stats	Auto-déclaré
VQAv2	78,6 %	2ᵉ / 3	llm-stats	Auto-déclaré
MT-Bench	76,8 %	11ᵉ / 12	llm-stats	Auto-déclaré
HumanEval	72,0 %	54ᵉ / 65	llm-stats	Auto-déclaré
MMLU	69,2 %	84ᵉ / 98	llm-stats	Auto-déclaré
IFEval	61,3 %	64ᵉ / 65	llm-stats	Auto-déclaré
MM-MT-Bench	60,5 %	4ᵉ / 17	llm-stats	Auto-déclaré
MathVista	58,0 %	27ᵉ / 38	llm-stats	Auto-déclaré
MMMU	52,5 %	54ᵉ / 61	llm-stats	Auto-déclaré
MATH	48,1 %	57ᵉ / 70	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Pixtral-12B se plaçait dans la partie supérieure des LLM de sa génération sur MATH, un benchmark centré sur les capacités mathématiques, parmi 36 modèles comparables publiés dans une fenêtre de temps proche. Sa fenêtre de contexte de 128 000 tokens constituait aussi un atout concret pour traiter de longs documents, de grands historiques de conversation ou des corpus volumineux sans découpage excessif. Sa licence Apache 2.0, associée à des poids ouverts et à l’usage commercial autorisé, en faisait un modèle exploitable hors API propriétaire, avec davantage de contrôle sur le déploiement.

Limites et points d'attention. Pixtral-12B doit être lu comme un modèle de 2024 : ses performances sont aujourd’hui largement dépassées par les générations plus récentes, et un modèle de cet âge est souvent retiré du catalogue actif de son éditeur. Sa coupure de connaissances au 30 juin 2024 limite aussi son intérêt pour les contenus récents. Les faits disponibles ne fournissent pas de chiffres vérifiés sur le coût d’entraînement ou l’équivalent en GPU H100, ce qui empêche d’évaluer précisément l’effort industriel derrière le modèle. La couverture repose sur deux sources concordantes, suffisante pour établir les principaux repères, mais limitée pour documenter finement ses performances au-delà des éléments listés.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

Pixtral-12B

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast