Alpha-News.org ➤ L'actualité du monde est ici
La société chinoise DeepSeek revendique un ratio théorique coût-bénéfice de 545% par jour.

BEIJING, 1er mars (Reuters) - Une startup chinoise en intelligence artificielle a révélé samedi quelques données de coûts et de revenus liés à ses modèles à succès V3 et R1, revendiquant un ratio théorique coût-profit allant jusqu'à 545 % par jour, bien qu'elle ait mis en garde que les revenus réels seraient significativement plus bas.

C'est la première fois que l'entreprise basée à Hangzhou dévoile des informations sur ses marges bénéficiaires des tâches d'"inférence" moins intensives en calcul, l'étape après l'entraînement qui consiste en des modèles d'IA entraînés à faire des prédictions ou à effectuer des tâches, comme via des chatbots.

Cette révélation pourrait davantage perturber les actions liées à l'IA en dehors de la Chine, alors que les chatbots sur le web et les applications alimentés par ses modèles R1 et V3 ont gagné en popularité à l'échelle mondiale.

La baisse des actions a été en partie causée par les affirmations de DeepSeek selon lesquelles elle aurait dépensé moins de 6 millions de dollars pour les puces utilisées pour entraîner le modèle, bien moins que ce que des concurrents américains comme OpenAI ont dépensé.

Les puces qu'elle aurait utilisées, les H800 de Nvidia, sont également bien moins puissantes que celles auxquelles ont accès OpenAI et d'autres entreprises d'IA américaines, ce qui amène les investisseurs à remettre encore davantage en question les promesses des entreprises d'IA américaines de dépenser des milliards de dollars dans des puces de pointe.

DeepSeek a déclaré dans un message publié sur GitHub samedi que en supposant que le coût de location d'une puce H800 est de 2 dollars par heure, le coût total d'inférence quotidien pour ses modèles V3 et R1 est de 87 072 dollars. En revanche, le revenu quotidien théorique généré par ces modèles est de 562 027 dollars, ce qui entraîne un ratio de coût-profit de 545 %. Sur une année, cela représenterait un peu plus de 200 millions de dollars de revenus.

Cependant, l'entreprise a ajouté que son "revenu réel est substantiellement inférieur" car le coût d'utilisation de son modèle V3 est inférieur à celui du modèle R1, seulement certains services sont monétisés alors que l'accès au web et aux applications reste gratuit, et que les développeurs...".