Pixtral-12B
Pixtral-12B est un LLM de Mistral AI publié le 17 septembre 2024 sous licence Apache 2.0, avec des poids ouverts et un usage commercial autorisé. Son positionnement combine un format relativement compact, 12 milliards de paramètres, et une fenêtre de contexte très large de 128 000 tokens.
Pixtral-12B est un LLM de Mistral AI publié le 17 septembre 2024 sous licence Apache 2.0, avec des poids ouverts et un usage commercial autorisé. Son positionnement combine un format relativement compact, 12 milliards de paramètres, et une fenêtre de contexte très large de 128 000 tokens.
Avec environ deux ans d’ancienneté, Pixtral-12B appartient déjà à une génération ancienne à l’échelle de l’IA. La fiche sert donc surtout à situer un modèle open-weights important de sa période, plutôt qu’un système à comparer directement aux modèles haut de gamme actuels.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Mistral AI |
| Licence | Apache 2.0 (open-weights, usage commercial autorisé) |
| Date de sortie | 17 septembre 2024 |
| Connaissances jusqu'à | 2024-06-30 |
| Multimodal | oui |
| Paramètres | 12 milliards |
| Fenêtre de contexte | 128 000 tokens |
| Modalités (entrée → sortie) | text,image → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| DocVQA | 90,7 % | 18ᵉ / 26 | llm-stats | Auto-déclaré |
| ChartQA | 81,8 % | 17ᵉ / 24 | llm-stats | Auto-déclaré |
| VQAv2 | 78,6 % | 2ᵉ / 3 | llm-stats | Auto-déclaré |
| MT-Bench | 76,8 % | 11ᵉ / 12 | llm-stats | Auto-déclaré |
| HumanEval | 72,0 % | 54ᵉ / 65 | llm-stats | Auto-déclaré |
| MMLU | 69,2 % | 84ᵉ / 98 | llm-stats | Auto-déclaré |
| IFEval | 61,3 % | 64ᵉ / 65 | llm-stats | Auto-déclaré |
| MM-MT-Bench | 60,5 % | 4ᵉ / 17 | llm-stats | Auto-déclaré |
| MathVista | 58,0 % | 27ᵉ / 38 | llm-stats | Auto-déclaré |
| MMMU | 52,5 % | 54ᵉ / 61 | llm-stats | Auto-déclaré |
| MATH | 48,1 % | 57ᵉ / 70 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Notre analyse
Forces. À sa sortie, Pixtral-12B se plaçait dans la partie supérieure des LLM de sa génération sur MATH, un benchmark centré sur les capacités mathématiques, parmi 36 modèles comparables publiés dans une fenêtre de temps proche. Sa fenêtre de contexte de 128 000 tokens constituait aussi un atout concret pour traiter de longs documents, de grands historiques de conversation ou des corpus volumineux sans découpage excessif. Sa licence Apache 2.0, associée à des poids ouverts et à l’usage commercial autorisé, en faisait un modèle exploitable hors API propriétaire, avec davantage de contrôle sur le déploiement.
Limites et points d'attention. Pixtral-12B doit être lu comme un modèle de 2024 : ses performances sont aujourd’hui largement dépassées par les générations plus récentes, et un modèle de cet âge est souvent retiré du catalogue actif de son éditeur. Sa coupure de connaissances au 30 juin 2024 limite aussi son intérêt pour les contenus récents. Les faits disponibles ne fournissent pas de chiffres vérifiés sur le coût d’entraînement ou l’équivalent en GPU H100, ce qui empêche d’évaluer précisément l’effort industriel derrière le modèle. La couverture repose sur deux sources concordantes, suffisante pour établir les principaux repères, mais limitée pour documenter finement ses performances au-delà des éléments listés.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).