OpenAI a publié un post-mortem sur le récent numéro de la sycophance avec le modèle AI par défaut CHATGPT, GPT-4O-ISUSS qui a forcé l’entreprise à retirer une mise à jour du modèle publié la semaine dernière.
Au cours du week-end, à la suite de la mise à jour du modèle GPT-4O, les utilisateurs sur les réseaux sociaux ont noté que Chatgpt a commencé à répondre d’une manière trop valide et agréable. Il est rapidement devenu a même eu. Les utilisateurs ont publié des captures d’écran de Chatgpt applaudir toutes sortes de décisions et d’idées problématiques et dangereuses.
Dans un article sur X dimanche, le PDG Sam Altman a reconnu le problème et a déclaré qu’Openai travaillerait sur les correctifs «dès que possible». Deux jours plus tard, Altman a annoncé que la mise à jour GPT-4O était en cours de reculature et qu’Openai travaillait sur des «correctifs supplémentaires» à la personnalité du modèle.
Selon OpenAI, la mise à jour, qui visait à rendre la personnalité par défaut du modèle «se sent plus intuitive et efficace», a été trop informée par des «commentaires à court terme» et «n’a pas entièrement pris en compte les interactions des utilisateurs avec Chatgpt évoluent au fil du temps.
Nous avons reculé la mise à jour GPT-4O de la semaine dernière dans Chatgpt car il était trop flatteur et agréable. Vous avez maintenant accès à une version antérieure avec un comportement plus équilibré.
En savoir plus sur ce qui s’est passé, pourquoi cela compte et comment nous abordons la sycophance: https://t.co/lohou7i7dc
– Openai (@openai) 30 avril 2025
« En conséquence, GPT – 4o a biaisé qui était trop favorable mais fallacieux », a écrit Openai dans un article de blog. «Les interactions sycophantiques peuvent être inconfortables, perturbées et provoquer une détresse. Nous avons échoué et nous travaillons à bien faire les choses.»
OpenAI dit qu’il met en œuvre plusieurs correctifs, notamment le raffinage de ses techniques de formation de modèle de base et de l’invite du système à diriger explicitement GPT-4O de la sycophance. (Les invites du système sont les instructions initiales qui guident le comportement global d’un modèle dans les interactions.) L’entreprise construit également plus de garde-corps de sécurité pour « augmenter l’honnêteté et la transparence du modèle) et continue d’étendre ses évaluations pour » aider à identifier la sycophance « , dit-il.
Openai dit également que cela expérimente des moyens de permettre aux utilisateurs de donner des «commentaires en temps réel» pour «influencer directement leurs interactions» avec Chatgpt et choisir parmi plusieurs personnalités de Chatgpt.
« (W) explore de nouvelles façons d’incorporer des commentaires plus larges et démocratiques dans les comportements par défaut de Chatgpt », a écrit la société dans son article de blog. «Nous pensons également que les utilisateurs devraient avoir plus de contrôle sur le comportement de Chatgpt et, dans la mesure où il est sûr et réalisable, effectuer des ajustements s’ils sont d’accord avec le comportement par défaut.