DeepSeek, une application de chatbot basée sur l'intelligence artificielle chinoise lancée la semaine dernière, a semé le chaos sur les marchés américains et soulevé des questions sur l'avenir de la domination américaine en matière d'IA. La BBC se penche sur le fonctionnement de l'application.
DeepSeek ressemble à n'importe quel autre chatbot, bien qu'il ait tendance à être bavard.
Tout comme avec ChatGPT d'OpenAI ou Gemini de Google, vous ouvrez l'application (ou le site Web) et lui posez des questions sur n'importe quel sujet, et il fait de son mieux pour vous répondre.
Il donne des réponses longues et refuse de donner son opinion, même si on la lui demande directement.
Le chatbot commence souvent sa réponse en disant que le sujet est "hautement subjectif" - que ce soit sur la politique (Donald Trump est-il un bon président américain ?) ou sur les boissons gazeuses (laquelle est plus savoureuse, Pepsi ou Coke ?).
Il n'a même pas voulu dire s'il était meilleur ou non que l'assistant d'intelligence artificielle (IA) concurrent de OpenAI, ChatGPT, mais a pesé le pour et le contre des deux - ChatGPT a fait exactement la même chose et a même utilisé un langage très similaire.
DeepSeek affirme avoir été formé sur des données allant jusqu'en octobre 2023, et bien que l'application semble avoir accès à des informations actuelles telles que la date d'aujourd'hui, la version du site Web ne l'a pas.
Cela n'est pas très différent des versions précédentes de ChatGPT et c'est probablement une tentative similaire de protection - pour empêcher le chatbot de débiter des informations erronées diffusées sur le Web en temps réel.
Il peut être assez rapide dans ses réponses, mais il est actuellement surchargé en raison du grand nombre de personnes qui se précipitent pour l'essayer puisqu'il est devenu viral.
Cependant, il existe un domaine dans lequel il est très différent de son concurrent américain - DeepSeek se censure lorsqu'il s'agit de sujets interdits en Chine.
Parfois, il commence une réponse, qui disparaît ensuite de l'écran et est remplacée par "parlons d'autre chose".
Un sujet clairement tabou est les manifestations de 1989 sur la place Tiananmen qui se sont terminées par la mort de 200 civils tués par l'armée selon le gouvernement chinois - d'autres estimations parlent de centaines à des milliers.
Mais DeepSeek ne répondra à aucune question à ce sujet, ni même de manière plus générale sur ce qui s'est passé en Chine ce jour-là.
Le ChatGPT développé aux États-Unis, en revanche, n'hésite pas dans ses réponses sur la place Tiananmen.
Kayla Blomquist, chercheuse à l'Institut d'Internet d'Oxford et directrice du Oxford China Policy Lab, déclare que relativement parlant", le gouvernement chinois a adopté une attitude "mains libres envers l'application.
Je dirais qu'il y a un changement, étant donné que nous avons vu une annonce d'un énorme investissement du gouvernement central la semaine dernière - cela pourrait probablement signaler un changement dans le futur.
DeepSeek présente les mêmes avertissements que tout autre chatbot en ce qui concerne l'exactitude, et ressemble à des assistants d'IA américains déjà bien établis et utilisés par des millions de personnes.
Pour beaucoup - notamment ceux qui n'ont pas accès aux services de haut niveau - cela semble probablement assez similaire.
Imaginez un problème mathématique pour lequel la réponse exacte s'étend sur 32 décimales, mais la version abrégée ne s'étend que sur huit.
Ce n'est pas tout à fait aussi précis - mais pour la plupart des gens, cela n'a pas d'importance.
Il se peut qu'il ait réussi à réduire les coûts et les calculs, mais nous savons qu'il est au moins en partie construit sur les épaules des géants : il utilise des puces Nvidia - même si ce sont des versions plus anciennes et moins chères - et exploite l'architecture open-source Llama de Meta, ainsi que l'équivalent Qwen d'AliBaba.
Je pense que cela remet absolument en question les stratégies de monétisation de nombreuses grandes entreprises d'IA américaines, a déclaré Mme Blomquist.
"Cela pointe vers des méthodes potentielles de développement de modèle beaucoup moins gourmandes en ressources et en calculs, ce qui pourrait potentiellement signaler un changement de paradigme, bien que cela reste à confirmer et à être démontré.
Nous verrons ce que les prochains mois nous réservent.