Phi 4 Reasoning Plus

Phi 4 Reasoning Plus est un LLM de Microsoft publié le 30 avril 2025, avec des poids ouverts sous licence MIT et un usage commercial autorisé. Il combine un format relativement compact de 14 milliards de paramètres avec une fenêtre de contexte de 32 768 tokens.

Phi 4 Reasoning Plus est un LLM de Microsoft publié le 30 avril 2025, avec des poids ouverts sous licence MIT et un usage commercial autorisé. Il combine un format relativement compact de 14 milliards de paramètres avec une fenêtre de contexte de 32 768 tokens.

Son ancienneté, environ un an, est déjà importante à l’échelle de l’IA générative. La fiche doit donc être lue comme le portrait d’un modèle de sa période, pertinent pour comprendre l’offre open-weights de Microsoft au printemps 2025, mais probablement dépassé par les générations récentes.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMicrosoft
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie30 avril 2025
Connaissances jusqu'à2025-03-01
Multimodalnon
Paramètres14 milliards
Fenêtre de contexte32 768 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
HumanEval+92,3 %2ᵉ / 10llm-statsAuto-déclaré
IFEval84,9 %38ᵉ / 65llm-statsAuto-déclaré
AIME 202481,3 %23ᵉ / 52llm-statsAuto-déclaré
Arena Hard79,0 %7ᵉ / 26llm-statsAuto-déclaré
AIME 202578,0 %69ᵉ / 108llm-statsAuto-déclaré
MMLU-Pro76,0 %65ᵉ / 125llm-statsAuto-déclaré
PhiBench74,2 %1ᵉ / 3llm-statsAuto-déclaré
GPQA68,9 %116ᵉ / 213llm-statsAuto-déclaré
LiveCodeBench53,1 %40ᵉ / 72llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Notre analyse

Forces. À sa sortie, Phi 4 Reasoning Plus se plaçait dans le haut du panier de sa génération sur GPQA, avec un positionnement dans le top 23% des LLM comparés sur la même période. Ce résultat en faisait un modèle solide pour sa catégorie, surtout au regard de sa taille de 14 milliards de paramètres. Sa licence MIT constitue aussi un point fort concret : les poids sont ouverts et l’usage commercial est autorisé, ce qui le distingue des modèles uniquement accessibles via API ou soumis à des restrictions plus fortes. Sa fenêtre de contexte de 32 768 tokens lui donne une capacité de traitement confortable pour des documents longs selon les standards de sa période.

Limites et points d'attention. Phi 4 Reasoning Plus est un modèle ancien dans un secteur où les performances évoluent très vite. Ses résultats doivent être comparés aux LLM disponibles autour de sa sortie, pas aux modèles frontière actuels, qui l’ont probablement largement dépassé. Il est aussi souvent moins visible, voire plus proposé par l’éditeur, dans les catalogues récents. La limite de connaissances au 1er mars 2025 impose également une prudence sur les faits postérieurs à cette date. La couverture repose sur 2 sources de données concordantes, ce qui apporte un socle cohérent, mais moins riche qu’une documentation complète et régulièrement maintenue.


Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).