LongCat-Flash-Lite

LongCat-Flash-Lite est un LLM de Meituan publié le 5 février 2026, avec des poids ouverts sous licence MIT et un usage commercial autorisé. Son positionnement associe un grand format de 68 milliards de paramètres à une fenêtre de contexte de 256 000 tokens.

LongCat-Flash-Lite est un LLM de Meituan publié le 5 février 2026, avec des poids ouverts sous licence MIT et un usage commercial autorisé. Son positionnement associe un grand format de 68 milliards de paramètres à une fenêtre de contexte de 256 000 tokens.

Le modèle se distingue surtout par un tarif très économique, annoncé 95% sous la moyenne des LLM similaires et environ 48.3 fois inférieur à celui des modèles frontière. Cette combinaison en fait un candidat orienté volume, contexte long et maîtrise des coûts.

Caractéristiques

CaractéristiqueValeur
TypeGrand modèle de langage (LLM)
ÉditeurMeituan
LicenceMIT (open-weights, usage commercial autorisé)
Date de sortie5 février 2026
Multimodalnon
Paramètres68 milliards
Fenêtre de contexte256 000 tokens
Modalités (entrée → sortie)text → text

Performances (benchmarks)

BenchmarkScoreRang (LLM)SourceFiabilité
MATH-50096,8 %10ᵉ / 31llm-statsAuto-déclaré
MMLU85,5 %36ᵉ / 98llm-statsAuto-déclaré
CMMLU82,5 %4ᵉ / 6llm-statsAuto-déclaré
MMLU-Pro78,3 %57ᵉ / 125llm-statsAuto-déclaré
Tau2 Retail73,1 %14ᵉ / 25llm-statsAuto-déclaré
Tau2 Telecom72,8 %24ᵉ / 34llm-statsAuto-déclaré
AIME 202472,2 %37ᵉ / 52llm-statsAuto-déclaré
GPQA66,8 %122ᵉ / 213llm-statsAuto-déclaré
AIME 202563,2 %88ᵉ / 108llm-statsAuto-déclaré
Tau2 Airline58,0 %12ᵉ / 22llm-statsAuto-déclaré
SWE-Bench Verified54,4 %81ᵉ / 100llm-statsAuto-déclaré
SWE-bench Multilingual38,1 %31ᵉ / 32llm-statsAuto-déclaré
Terminal-Bench33,8 %15ᵉ / 25llm-statsAuto-déclaré

« Auto-déclaré » : score communiqué par l'éditeur, non rejoué indépendamment. « Mesuré » : évalué par un tiers (Epoch AI, LiveBench). Le rang est calculé parmi les LLM évalués sur le même benchmark.

Tarifs

FournisseurEntrée / 1MSortie / 1MCache lecture / 1M
meituan0,1 $0,4 $n.d.

Prix en dollars US par million de tokens.

Sa tarification se situe 95 % en dessous de la moyenne des LLM similaires, et 48,3 fois moins cher que les modèles frontières (Claude Fable 5, GPT-5.4, Gemini 3.1 Pro Preview).

Notre analyse

Forces. LongCat-Flash-Lite réunit trois atouts concrets : une très grande fenêtre de contexte, une licence MIT compatible avec les usages commerciaux, et un coût d’inférence nettement inférieur aux standards de sa catégorie. Le tarif d’entrée à 0.1 $ par million de tokens et le tarif de sortie à 0.4 $ par million de tokens renforcent son intérêt pour les traitements intensifs en texte. À sa sortie, son résultat sur GPQA le plaçait dans le top 57% des LLM de sa génération, un niveau exploitable mais non dominant.

Limites et points d'attention. Le positionnement prix est plus marquant que le niveau de performance connu : le classement GPQA situe LongCat-Flash-Lite dans une zone intermédiaire, loin du haut du panier de sa génération. La couverture repose sur 1 source de données concordante, ce qui limite la profondeur de validation publique. Aucun autre benchmark n’est fourni ici pour apprécier le code, les tâches agentiques ou les mathématiques avancées. Le modèle convient surtout aux usages où le contexte long, les poids ouverts et le coût par token priment sur la recherche de performances de pointe.


Sources des données : LLM-Stats (llm-stats.com).