Il présente un niveau comparable à ChatGPT, mais utilise moins de ressources informatiques.
Le chatbot est développé par une entreprise chinoise du même nom, fondée en 2023 par Liang Wenfeng, cofondateur du fonds spéculatif High-Flyer. Le chatbot est alimenté par un grand modèle linguistique (LLM) propriétaire capable de générer du texte, de rechercher des informations, d’analyser des images et d’écrire du code en C++, Python, Java et d’autres langages.
DeepSeek cite le faible coût de formation du modèle comme un avantage clé. L’entreprise a utilisé des GPU Nvidia H800 moins puissants pour réduire les coûts. Selon les calculs, l’entraînement de DeepSeek-V3 a coûté 5,6 millions de dollars, soit beaucoup moins que les modèles analogues d’OpenAI et de Google. Cela a suscité l’inquiétude des investisseurs : les actions de Nvidia ont chuté de 18 % et la capitalisation boursière de l’entreprise a baissé, derrière Apple et Microsoft.
Le 20 janvier, DeepSeek a mis ses modèles R1-Zero et R1 à la disposition du public, permettant ainsi aux développeurs du monde entier de les utiliser pour leurs propres projets. Dès le 27 janvier, une application basée sur ces modèles a dépassé ChatGPT dans l’App Store américain par le nombre de téléchargements.
Les experts notent que DeepSeek atteint un niveau comparable à celui d’OpenAI, mais qu’il utilise moins de ressources informatiques. L’ouverture du modèle permet aux entreprises de l’adapter à leurs tâches, sans passer par les API payantes des développeurs américains. Selon les analystes, les solutions chinoises pourraient prendre une position dominante sur le marché, surtout si OpenAI ne réduit pas les prix de ses produits.