Phi-3.5-mini-instruct

Phi-3.5-mini-instruct est un LLM compact de Microsoft, publié le 23 août 2024 sous licence MIT, avec des poids ouverts et un usage commercial autorisé. Avec 4 milliards de paramètres, il se place dans la catégorie des modèles légers, tout en proposant une fenêtre de contexte très large…

Phi-3.5-mini-instruct est un LLM compact de Microsoft, publié le 23 août 2024 sous licence MIT, avec des poids ouverts et un usage commercial autorisé. Avec 4 milliards de paramètres, il se place dans la catégorie des modèles légers, tout en proposant une fenêtre de contexte très large de 128 000 tokens.

Son ancienneté d’environ deux ans est importante à l’échelle de l’IA. La fiche le situe donc surtout comme un modèle de sa génération, avec des connaissances arrêtées au 31 mars 2024, plutôt que comme une référence actuelle face aux modèles haut de gamme récents.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMicrosoft
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie23 août 2024
Connaissances jusqu'à2024-03-31
Multimodalnon
Paramètres4 milliards
Fenêtre de contexte128 000 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
GSM8k86,2 %33ᵉ / 47llm-statsAuto-déclaré
ARC-C84,6 %14ᵉ / 34llm-statsAuto-déclaré
RULER84,1 %4ᵉ / 4llm-statsAuto-déclaré
PIQA81,0 %5ᵉ / 11llm-statsAuto-déclaré
OpenBookQA79,2 %2ᵉ / 5llm-statsAuto-déclaré
BoolQ78,0 %8ᵉ / 10llm-statsAuto-déclaré
Social IQa74,7 %2ᵉ / 9llm-statsAuto-déclaré
MBPP69,6 %23ᵉ / 33llm-statsAuto-déclaré
HellaSwag69,4 %25ᵉ / 27llm-statsAuto-déclaré
BIG-Bench Hard69,0 %14ᵉ / 20llm-statsAuto-déclaré
MMLU69,0 %85ᵉ / 98llm-statsAuto-déclaré
Winogrande68,5 %18ᵉ / 22llm-statsAuto-déclaré
TruthfulQA64,0 %5ᵉ / 18llm-statsAuto-déclaré
HumanEval62,8 %61ᵉ / 65llm-statsAuto-déclaré
MMMLU55,4 %48ᵉ / 49llm-statsAuto-déclaré
MATH48,5 %56ᵉ / 70llm-statsAuto-déclaré
MGSM47,9 %30ᵉ / 30llm-statsAuto-déclaré
MMLU-Pro47,4 %113ᵉ / 125llm-statsAuto-déclaré
Arena Hard37,0 %23ᵉ / 26llm-statsAuto-déclaré
GPQA30,4 %203ᵉ / 213llm-statsAuto-déclaré
SQuALITY24,3 %1ᵉ / 5llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Phi-3.5-mini-instruct se distinguait par un bon positionnement sur GPQA, un benchmark orienté questions scientifiques complexes, où il figurait dans le haut du panier des LLM de la même période. Son format de 4 milliards de paramètres en faisait un modèle relativement compact, intéressant pour analyser le compromis entre taille réduite, licence permissive et fenêtre de contexte étendue. La licence MIT renforce aussi son intérêt historique, car elle autorise l’usage commercial avec des poids ouverts.

Limites et points d'attention. Phi-3.5-mini-instruct est aujourd’hui un modèle ancien : environ deux ans représentent un écart très long dans le cycle de renouvellement des LLM. Ses performances doivent être lues par rapport aux modèles sortis autour de 2024, pas par rapport aux modèles frontière actuels, qui l’ont largement dépassé. Il peut aussi avoir disparu des catalogues actifs de l’éditeur, ce qui réduit son intérêt opérationnel. Sa date de coupure des connaissances, fixée au 31 mars 2024, limite en outre toute analyse d’événements ou de technologies apparus ensuite.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).