DeepSeek

Un éditeur chinois centré sur des modèles performants, efficaces et largement ouverts

29 fiches modèlesorties 29 novembre 2023 → 24 avril 202616 à poids ouverts3 multimodauxcontexte jusqu'à 1 048 576 tokens (≈ 1,0 M)

DeepSeek est un éditeur chinois de modèles d’IA fondé à Hangzhou, associé à l’écosystème de recherche et d’investissement de High-Flyer. L’entreprise s’est fait connaître par une approche centrée sur l’efficacité, la publication de modèles compétitifs et une volonté de rendre une partie de ses travaux accessibles à la communauté technique.

Dans le catalogue, DeepSeek apparaît comme un acteur à la fois orienté recherche et production, avec des familles couvrant les modèles généralistes, le raisonnement et certains usages multimodaux. Une part importante de l’offre repose sur des poids ouverts autorisant l’usage commercial, tandis que d’autres modèles relèvent d’une logique plus contrôlée. Les fiches les plus documentées portent notamment sur DeepSeek-V3.2, DeepSeek-V3.2-Exp, DeepSeek-V3, DeepSeek V4 Pro, DeepSeek-V4-Pro-Max et DeepSeek-R1-0528.

Ces modèles s’adressent surtout aux équipes qui cherchent à comparer, intégrer ou spécialiser des systèmes de génération de texte, de raisonnement et d’analyse, avec un intérêt marqué pour les longues fenêtres de contexte et les déploiements maîtrisés.