Microsoft

Phi-4-multimodal-instruct

Phi-4-multimodal-instruct est un LLM de Microsoft publié le 1 février 2025, sous licence MIT avec poids ouverts et usage commercial autorisé. Son positionnement associe un format compact de 6 milliards de paramètres à une fenêtre de contexte de 131 072 tokens, avec des connaissances…

À près d’un an, son ancienneté est déjà très longue à l’échelle de l’IA. La fiche doit donc le situer par rapport aux modèles de sa période, car ses performances sont probablement dépassées aujourd’hui et ce type de modèle est souvent retiré du catalogue de l’éditeur.

Caractéristiques

Caractéristique	Valeur
Type	Grand modèle de langage (LLM)
Éditeur	Microsoft
Licence	MIT (open-weights, usage commercial autorisé)
Date de sortie	1 février 2025
Connaissances jusqu'à	2024-06-01
Multimodal	oui
Paramètres	6 milliards
Fenêtre de contexte	131 072 tokens
Modalités (entrée → sortie)	text,image → text

Performances (benchmarks)

Benchmark	Score	Rang (LLM)	Source	Fiabilité
DocVQA	93,2 %	13ᵉ / 26	llm-stats	Auto-déclaré
MMBench	86,7 %	3ᵉ / 9	llm-stats	Auto-déclaré
OCRBench	84,4 %	16ᵉ / 22	llm-stats	Auto-déclaré
AI2D	82,3 %	27ᵉ / 32	llm-stats	Auto-déclaré
ChartQA	81,4 %	19ᵉ / 24	llm-stats	Auto-déclaré
TextVQA	75,6 %	10ᵉ / 15	llm-stats	Auto-déclaré
InfoVQA	72,7 %	5ᵉ / 9	llm-stats	Auto-déclaré
MathVista	62,4 %	24ᵉ / 38	llm-stats	Auto-déclaré
BLINK	61,3 %	13ᵉ / 13	llm-stats	Auto-déclaré
MMMU	55,1 %	50ᵉ / 61	llm-stats	Auto-déclaré
Video-MME	55,0 %	17ᵉ / 17	llm-stats	Auto-déclaré
MMMU-Pro	38,5 %	57ᵉ / 60	llm-stats	Auto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. Phi-4-multimodal-instruct se distingue d’abord par son statut open-weights sous licence MIT, qui autorise les usages commerciaux sans dépendre uniquement d’une API propriétaire. Sa taille de 6 milliards de paramètres le place dans la catégorie des LLM compacts, avec un intérêt pratique pour les environnements qui privilégient un modèle moins volumineux. Sa fenêtre de contexte de 131 072 tokens constitue son autre atout concret, car elle permet de traiter des entrées longues à l’échelle de sa génération. La couverture repose sur deux sources concordantes, ce qui renforce la fiabilité des informations de base disponibles sur le modèle.

Limites et points d'attention. Son âge est le principal frein : sorti début 2025, il doit être lu comme un modèle de sa période, non comme une référence actuelle. Ses performances sont probablement largement dépassées par les modèles haut de gamme récents, et il peut ne plus être mis en avant dans le catalogue de Microsoft. Les données disponibles ne fournissent pas de résultats de benchmark, ni d’éléments chiffrés sur le coût ou le calcul d’entraînement, ce qui empêche d’évaluer précisément son niveau réel face aux modèles de sa génération.

Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).

Phi-4-multimodal-instruct

Caractéristiques

Performances (benchmarks)

Notre analyse

À lire ensuite

qwen3.6-plus-04-02

nova-2-lite-v1

Grok Code Fast