Phi 4 Mini
Phi 4 Mini est un LLM de Microsoft publié le 30 avril 2025, sous licence MIT avec poids ouverts et usage commercial autorisé. Son positionnement combine un format compact de 4 milliards de paramètres, une très grande fenêtre de contexte et un tarif très économique.
Phi 4 Mini est un LLM de Microsoft publié le 30 avril 2025, sous licence MIT avec poids ouverts et usage commercial autorisé. Son positionnement combine un format compact de 4 milliards de paramètres, une très grande fenêtre de contexte et un tarif très économique.
À l’échelle de l’IA, son ancienneté d’environ un an est déjà importante. Phi 4 Mini doit donc être lu comme un modèle de sa génération, performant et peu coûteux à sa sortie, mais probablement dépassé par les meilleurs LLM récents.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Microsoft |
| Licence | MIT (open-weights, usage commercial autorisé) |
| Date de sortie | 30 avril 2025 |
| Connaissances jusqu'à | 2024-06-01 |
| Multimodal | non |
| Paramètres | 4 milliards |
| Fenêtre de contexte | 131 072 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MATH-500 | 94,6 % | 18ᵉ / 31 | llm-stats | Auto-déclaré |
| GSM8k | 88,6 % | 31ᵉ / 47 | llm-stats | Auto-déclaré |
| ARC-C | 83,7 % | 15ᵉ / 34 | llm-stats | Auto-déclaré |
| BoolQ | 81,2 % | 7ᵉ / 10 | llm-stats | Auto-déclaré |
| OpenBookQA | 79,2 % | 2ᵉ / 5 | llm-stats | Auto-déclaré |
| PIQA | 77,6 % | 10ᵉ / 11 | llm-stats | Auto-déclaré |
| Social IQa | 72,5 % | 3ᵉ / 9 | llm-stats | Auto-déclaré |
| BIG-Bench Hard | 70,4 % | 11ᵉ / 20 | llm-stats | Auto-déclaré |
| HellaSwag | 69,1 % | 26ᵉ / 27 | llm-stats | Auto-déclaré |
| MMLU | 67,3 % | 88ᵉ / 98 | llm-stats | Auto-déclaré |
| Winogrande | 67,0 % | 19ᵉ / 22 | llm-stats | Auto-déclaré |
| TruthfulQA | 66,4 % | 4ᵉ / 18 | llm-stats | Auto-déclaré |
| MATH | 64,0 % | 44ᵉ / 70 | llm-stats | Auto-déclaré |
| MGSM | 63,9 % | 23ᵉ / 30 | llm-stats | Auto-déclaré |
| MMLU-Pro | 52,8 % | 107ᵉ / 125 | llm-stats | Auto-déclaré |
| Multilingual MMLU | 49,3 % | 5ᵉ / 5 | llm-stats | Auto-déclaré |
| Arena Hard | 32,8 % | 24ᵉ / 26 | llm-stats | Auto-déclaré |
| GPQA | 25,2 % | 207ᵉ / 213 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| Weights & Biases | 0,08 $ | 0,35 $ | 0,08 $ |
Prix en dollars US par million de tokens.
Sa tarification se situe 96 % en dessous de la moyenne des LLM similaires, et 60,4 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Notre analyse
Forces. À sa sortie, Phi 4 Mini figurait dans le haut du panier de sa génération sur GPQA, avec un classement dans le top 97% parmi les LLM comparables de la même période. Son intérêt tient aussi à son compromis coût-format : 4 milliards de paramètres, une fenêtre de contexte de 131 072 tokens et une tarification annoncée 96% sous la moyenne des LLM similaires. Face aux modèles frontière, l’écart de prix est particulièrement marqué, avec un coût environ 60.4 fois inférieur. La licence MIT et les poids ouverts renforcent son intérêt pour des usages commerciaux nécessitant un modèle réutilisable sans dépendre uniquement d’une API propriétaire.
Limites et points d'attention. Phi 4 Mini est un modèle ancien pour le marché de l’IA générative : ses performances sont aujourd’hui largement dépassées par les modèles récents, et ce type de modèle est souvent retiré du catalogue de l’éditeur après quelques cycles. Sa limite de connaissances au 1er juin 2024 réduit aussi sa pertinence sur les sujets récents. Les données disponibles reposent sur 2 sources concordantes, ce qui suffit à établir les principaux repères, mais ne documente pas d’effort d’entraînement chiffré en GPU H100 ou en coût.
Sources des données : LLM-Stats (llm-stats.com) · OpenRouter (openrouter.ai).