LongCat-Flash-Lite
LongCat-Flash-Lite est un LLM de Meituan publié le 5 février 2026, avec des poids ouverts sous licence MIT et un usage commercial autorisé. Son positionnement associe un grand format de 68 milliards de paramètres à une fenêtre de contexte de 256 000 tokens.
LongCat-Flash-Lite est un LLM de Meituan publié le 5 février 2026, avec des poids ouverts sous licence MIT et un usage commercial autorisé. Son positionnement associe un grand format de 68 milliards de paramètres à une fenêtre de contexte de 256 000 tokens.
Le modèle se distingue surtout par un tarif très économique, annoncé 95% sous la moyenne des LLM similaires et environ 48.3 fois inférieur à celui des modèles frontière. Cette combinaison en fait un candidat orienté volume, contexte long et maîtrise des coûts.
Caractéristiques
| Caractéristique | Valeur |
|---|---|
| Type | Grand modèle de langage (LLM) |
| Éditeur | Meituan |
| Licence | MIT (open-weights, usage commercial autorisé) |
| Date de sortie | 5 février 2026 |
| Multimodal | non |
| Paramètres | 68 milliards |
| Fenêtre de contexte | 256 000 tokens |
| Modalités (entrée → sortie) | text → text |
Performances (benchmarks)
| Benchmark | Score | Rang (LLM) | Source | Fiabilité |
|---|---|---|---|---|
| MATH-500 | 96,8 % | 10ᵉ / 31 | llm-stats | Auto-déclaré |
| MMLU | 85,5 % | 36ᵉ / 98 | llm-stats | Auto-déclaré |
| CMMLU | 82,5 % | 4ᵉ / 6 | llm-stats | Auto-déclaré |
| MMLU-Pro | 78,3 % | 57ᵉ / 125 | llm-stats | Auto-déclaré |
| Tau2 Retail | 73,1 % | 14ᵉ / 25 | llm-stats | Auto-déclaré |
| Tau2 Telecom | 72,8 % | 24ᵉ / 34 | llm-stats | Auto-déclaré |
| AIME 2024 | 72,2 % | 37ᵉ / 52 | llm-stats | Auto-déclaré |
| GPQA | 66,8 % | 122ᵉ / 213 | llm-stats | Auto-déclaré |
| AIME 2025 | 63,2 % | 88ᵉ / 108 | llm-stats | Auto-déclaré |
| Tau2 Airline | 58,0 % | 12ᵉ / 22 | llm-stats | Auto-déclaré |
| SWE-Bench Verified | 54,4 % | 81ᵉ / 100 | llm-stats | Auto-déclaré |
| SWE-bench Multilingual | 38,1 % | 31ᵉ / 32 | llm-stats | Auto-déclaré |
| Terminal-Bench | 33,8 % | 15ᵉ / 25 | llm-stats | Auto-déclaré |
« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.
Tarifs
| Fournisseur | Entrée / 1M | Sortie / 1M | Cache lecture / 1M |
|---|---|---|---|
| meituan | 0,1 $ | 0,4 $ | n.d. |
Prix en dollars US par million de tokens.
Sa tarification se situe 95 % en dessous de la moyenne des LLM similaires, et 48,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).
Notre analyse
Forces. LongCat-Flash-Lite réunit trois atouts concrets : une très grande fenêtre de contexte, une licence MIT compatible avec les usages commerciaux, et un coût d’inférence nettement inférieur aux standards de sa catégorie. Le tarif d’entrée à 0.1 $ par million de tokens et le tarif de sortie à 0.4 $ par million de tokens renforcent son intérêt pour les traitements intensifs en texte. À sa sortie, son résultat sur GPQA le plaçait dans le top 57% des LLM de sa génération, un niveau exploitable mais non dominant.
Limites et points d'attention. Le positionnement prix est plus marquant que le niveau de performance connu : le classement GPQA situe LongCat-Flash-Lite dans une zone intermédiaire, loin du haut du panier de sa génération. La couverture repose sur 1 source de données concordante, ce qui limite la profondeur de validation publique. Aucun autre benchmark n’est fourni ici pour apprécier le code, les tâches agentiques ou les mathématiques avancées. Le modèle convient surtout aux usages où le contexte long, les poids ouverts et le coût par token priment sur la recherche de performances de pointe.
Sources des données : LLM-Stats (llm-stats.com).