PÉKIN, 27 janvier (Reuters) - Le lancement des derniers modèles d'IA de la start-up chinoise DeepSeek, affirmant être à égalité ou surpasser les modèles de pointe de l'industrie aux États-Unis à une fraction du coût, menace de bouleverser l'ordre technologique mondial.
La société a attiré l'attention dans les cercles mondiaux de l'IA après avoir indiqué dans un article le mois dernier que l'entraînement de DeepSeek-V3 n'avait nécessité que moins de 6 millions de dollars de puissance informatique des puces Nvidia H800.
L'Assistant IA de DeepSeek, alimenté par DeepSeek-V3, a détrôné ChatGPT pour devenir l'application gratuite la mieux notée sur l'App Store d'Apple aux États-Unis.
Cela a suscité des doutes sur la logique derrière la décision de certaines entreprises technologiques américaines d'investir des milliards de dollars dans l'IA, et plusieurs grands acteurs technologiques, y compris Nvidia, en ont souffert.
Voici quelques faits sur l'entreprise qui secoue le secteur de l'IA à l'échelle mondiale.
La sortie de ChatGPT d'OpenAI à la fin de 2022 a provoqué une , qui se sont empressées de créer leurs propres chatbots alimentés par l'intelligence artificielle.
Mais après la sortie du premier équivalent chinois de ChatGPT, créé par le géant des moteurs de recherche Baidu , des doutes sont apparus en Chine quant à l'écart de capacités en IA entre les entreprises américaines et chinoises.
La qualité et l'efficacité coût de modèles de DeepSeek ont inversé ce récit. Les deux modèles qui ont été acclamés à la fois par les dirigeants de la Silicon Valley et les ingénieurs d'entreprises technologiques américaines, DeepSeek-V3 et DeepSeek-R1, sont à égalité avec les modèles les plus avancés d'OpenAI et de Meta, selon la start-up chinoise.
Ils sont également moins chers à utiliser. Le DeepSeek-R1, publié la semaine dernière, est de 20 à 50 fois moins cher à utiliser que le modèle d'OpenAI o1, selon un article sur le compte officiel WeChat de DeepSeek.
Mais certains ont exprimé publiquement leur scepticisme quant au succès de DeepSeek.
Le PDG de Scale AI, Alexandr Wang, a déclaré lors d'une interview avec CNBC jeudi, sans fournir de preuves, que DeepSeek disposait de 50 000 puces Nvidia H100, qu'il prétendait ne pas divulguer car cela violerait les contrôles à l'exportation de Washington interdisant la vente de telles puces d'IA avancées à des entreprises chinoises. DeepSeek n'a pas répondu immédiatement à une demande de commentaire sur l'allégation.
Les analystes de Bernstein ont souligné lundi dans une note de recherche que les coûts totaux de formation du modèle V3 de DeepSeek étaient inconnus mais étaient bien supérieurs aux 5,58 millions de dollars auxquels la start-up avait déclaré avoir utilisé en puissance de calcul. Les analystes ont également indiqué que les coûts de formation du modèle R1, également très acclamé, n'avaient pas été divulgués.
DeepSeek est une start-up basée à Hangzhou dont l'actionnaire majoritaire est Liang Wenfeng, co-fondateur d'un fonds spéculatif quantitatif High-Flyer, selon les registres d'entreprise chinois.
Le fonds de Liang a annoncé en mars 2023 sur son compte WeChat officiel qu'il repartait de zéro", allant au-delà du trading pour concentrer ses ressources sur la création d'un "nouveau groupe de recherche indépendant, pour explorer l'essence de l'AGI (Intelligence Artificielle Générale). DeepSeek a été créé plus tard cette année-là.
Les créateurs de ChatGPT, OpenAI, définissent l'AGI comme des systèmes autonomes dépassant les humains dans la plupart des tâches économiquement valorisées.
Il n'est pas clair combien High-Flyer a investi dans DeepSeek. High-Flyer a un bureau situé dans le même immeuble que DeepSeek, et détient également des brevets liés aux clusters de puces utilisés pour former les modèles d'IA, selon les registres d'entreprise chinois.
L'unité IA de High-Flyer a déclaré sur son compte WeChat officiel en juillet 2022 qu'elle possédait et exploitait un cluster de 10 000 puces A100.
Le succès de DeepSeek a déjà été remarqué dans les cercles politiques les plus élevés de la Chine. Le 20 janvier, jour de la sortie de DeepSeek-R1 au public, le fondateur Liang a participé à un symposium privé pour hommes d'affaires et experts organisé par le Premier ministre chinois Li Qiang, selon l'agence de presse d'État Xinhua.
La présence de Liang à cette réunion est potentiellement le signe que le succès de DeepSeek pourrait être important pour l'objectif politique de Pékin de surmonter les contrôles à l'exportation de Washington et d'atteindre l'autosuffisance dans des industries stratégiques comme l'IA.
Un symposium similaire l'année dernière a été assisté par le PDG de Baidu, Robin Li.