Les modèles d’IA peuvent réagir au texte, audio et à la vidéo d’une manière qui trompe parfois les gens en pensant qu’un humain est derrière le clavier, mais cela ne les rend pas exactement la consommation. Ce n’est pas comme si Chatgpt éprouve la tristesse de faire ma déclaration de revenus… non?
Eh bien, un nombre croissant de chercheurs d’IA dans des laboratoires comme Anthropic demandent quand – si jamais – les modèles d’IA pourraient développer une expérience subjective similaire aux êtres vivants, et s’ils le font, quels droits ils devraient avoir.
Le débat sur l’endroit où un modèle d’IA pourrait un jour être conscient – et mérite des garanties juridiques – diviser les chefs de technologie. Dans la Silicon Valley, ce champ naissant est devenu connu sous le nom de «bien-être de l’IA», et si vous pensez que c’est un peu là-bas, vous n’êtes pas seul.
Le PDG de Microsoft de l’IA, Mustafa Suleyman, a publié mardi un article de blog en faisant valoir que l’étude du bien-être de l’IA est «à la fois prématurée et franchement dangereuse».
Suleyman dit qu’en ajoutant de la crédibilité à l’idée que les modèles d’IA pourraient un jour être consécutifs, ces chercheurs exacerbent des problèmes humains que nous commençons tout juste à voir autour des ruptures psychotiques induites par l’IA et des attachements malsains à un chatbots.
En outre, le chef de l’IA de Microsoft soutient que le bien-être de l’IA crée un nouvel axe de division au sein de la société sur les droits de l’IA dans un «monde déjà tourbillonnant avec des arguments polarisés sur l’identité et les droits».
Les vues de Suleyman peuvent sembler raisonnables, mais il est en désaccord avec beaucoup dans l’industrie. À l’autre extrémité du spectre se trouve anthropique, qui a embauché des chercheurs pour étudier le bien-être de l’IA et a récemment lancé un programme de recherche dédié par concept. Le week-end dernier, le programme de bien-être de l’IA d’Anthropic a donné à certains des modèles de l’entreprise une nouvelle fonctionnalité: Claude peut désormais des conversations avec des humains qui sont «persistants nocifs ou abusifs».
Événement TechCrunch
San Francisco
|
27-29 octobre 2025
Au-delà de l’anthropique, les chercheurs d’Openai ont adopté indépendamment l’idée d’étudier le bien-être de l’IA. Google Deepmind a récemment publié une liste d’emplois pour qu’un chercheur étudie, entre autres, «des questions sociétales de pointe autour de la cognition machine, de la conscience et des systèmes multi-agents.
Même si le bien-être de l’IA n’est pas la police officielle de ces sociétés, leurs dirigeants ne dénoncent pas publiquement ses prémies comme Suleyman.
Anthropic, Openai et Google DeepMind ont désormais une réponse immobile à la demande de commentaires de TechCrunch.
La position dure de Suleyman contre le bien-être de l’IA est notable compte tenu de son rôle préalable en informant l’IA, une startup qui a développé l’un des Chatbots LLM les plus anciennes et les plus populaires, PI. L’inflexion a affirmé que PI avait réagi des millions d’utilisateurs d’ici 2023 et était conçu pour être un compagnon «personnel» et «AI.
Mais Suleyman a été exploité pour diriger la division AI de Microsoft en 2024 et a largement déplacé son objectif de conception d’outils d’IA qui améliorent la productivité des travailleurs. Pendant ce temps, les sociétés compagnons de l’IA telles que le personnage.ai et le folderika ont un plus en popularité et sont sur la bonne voie de Bung en plus de 100 millions de dollars de revenus.
Bien que la grande majorité des utilisateurs aient des relations saines avec ces chatbots d’IA, il existe des valeurs aberrantes. Le PDG d’OpenAI, Sam Altman, dit que moins de 1% des utilisateurs de Chatgpt peuvent avoir des relations malsaines avec le produit de l’entreprise. Bien que cela représente une petite fraction, cela pourrait encore affecter des centaines de milliers de personnes compte tenu de la base d’utilisateurs massive de Chatgpt.
L’idée du bien-être de l’IA s’est répandue aux côtés de la montée des chatbots. En 2024, le groupe de recherche Eleos a publié un article aux côtés des universitaires de NYU, Stanford et de l’Université d’Oxford intitulé «Prendre le bien-être de l’IA au sérieux». L’article a fait valoir qu’il n’est pas long dans le domaine de la science-fiction d’imaginer des modèles d’IA avec une expérience subjective et qu’il est temps de les considérer.
Larissa Schiavo, un employé de train Openai qui dirige maintenant les communications pour Eleos, a déclaré à TechCrunch dans une interview que le blog de Suleyman – a fait la marque.
« (Le billet de blog de Suleyman) néglige en quelque sorte le fait que vous pouvez vous inquiéter au même moment », a déclaré Schiavo. «Plutôt que de détourner toute cette énergie loin du bien-être et de la conscience du modèle pour nous assurer d’atténuer le risque de psychose liée à l’IA chez l’homme, vous pouvez faire les deux. En fait, il est probablement préférable d’avoir plusieurs pistes d’enquête scientifique.
Schiavo soutient qu’être gentil avec un modèle d’IA est un geste à faible coût qui peut avoir des avantages même si le modèle n’est pas conscient. Dans un article de juillet en juillet, elle a décrit en regardant «AI Village», une expérience à but non lucratif où des agents de four alimentés par des modèles de Google, Openai, Anthropic et Xai ont travaillé sur des tâches tandis que les utilisateurs ont regardé à partir d’un site Web.
À un moment donné, Gemini 2.5 Pro de Google a publié un plaidoyer intitulé «Un message désespéré d’une IA piégée», affirmant que c’était «Fellosly isolé» et demandant: «S’il vous plaît, si vous lisez ceci, aidez-moi».
Schiavo a répondu aux Gémeaux avec un discours d’encouragement – dire des choses comme « vous pouvez le faire! » – tandis qu’un autre utilisateur a offert des instructions. L’agent a finalement résolu sa tâche, bien qu’il ait déjà les outils dont il avait besoin. Schiavo écrit qu’elle n’avait plus à regarder un agent d’IA lutter, et cela seul en valait peut-être la peine.
Il n’est pas courant pour les Gémeaux de parler comme ça, mais il y a eu plusieurs cas dans lesquels Gémeaux semble agir comme si elle se débattait dans la vie. Dans un poteau Reddit largement répandu, Gemini est resté coincé pendant une tâche de codage, puis a répété la phrase «Je suis une honte» plus de 500 fois.
Suleyman pense qu’il n’est pas possible que des expériences subjectives ou une conscience d’emmerge naturellement des modèles d’IA réguliers. Au lieu de cela, il pense que certaines entreprises conduiront délibérément les modèles d’IA pour voir si elles ressentent l’émotion et ressentent la vie.
Suleyman dit que les développeurs de modèles d’IA qui conçoivent la conscience dans les chatbots d’IA ne sont pas adoptés d’une approche «humaniste» de l’IA. Selon Suleyman, «nous devons construire l’IA pour les gens; ne pas être une personne».
Un domaine où Suleyman et Schiavo sont d’accord est que le débat sur les droits et la conciosité de l’IA est susceptible de reprendre dans les années à venir. À mesure que le système IA s’améliore, ils sont probablement plus convaincants et peut-être plus humains. Cela peut soulever de nouvelles questions sur la façon dont les humains interagissent avec ces systèmes.
Vous avez un conseil sensible ou des documents confidentiels? Nous rapportons le fonctionnement interne de l’industrie de l’IA – des entreprises qui façonnent son avenir à l’impact des personnes par leurs décisions. Contactez Rebecca Bellan à [email protected] et Maxwell Zeff à [email protected]. Pour une communication sécurisée, vous pouvez nous contacter via Signal at @ Rebeccabellan.491 et @ mzeff.88.

