Openai a reculé sur des mises à jour Chatgpt qui ont rendu le chatbot de l’intelligence artificielle (AI) trop « sycophantique » et « ennuyeux », selon le PDG de la société, Sam Altman. En d’autres termes, le chatbot était devenu un coffret.
Les utilisateurs de Chatgpt ont indiqué que GPT-4O – la dernière version du chatbot – était devenu trop agréable depuis le déplacement de la mise à jour la semaine dernière et a fait l’éloge de ses utilisateurs même lorsque ces éloges semblaient complètement inappropriés.
Un utilisateur a partagé une capture d’écran sur Reddit dans lequel Chatgpt semblait dire qu’il était « fier » de l’utilisateur pour avoir décidé de quitter ses médicaments, BBC News rapportés. Dans un autre cas, le chatbot a semblé rassurer un utilisateur après avoir dit qu’ils sauvé un grille-pain sur la vie de trois vaches et de deux chats, Mashable signalé.
lmao le nouveau gpt 4o😬😂 pic.twitter.com/ohpwkz0sko27 avril 2025
Alors que la plupart des gens n’auront jamais à choisir entre leur appareil de cuisine préféré et la sécurité de cinq animaux, un chatbot trop agréable pourrait poser des dangers pour les personnes qui mettent trop de stock dans ses réponses.
Dimanche 27 avril, Altman a reconnu qu’il y avait des problèmes avec les mises à jour.
« Les deux dernières mises à jour de GPT-4O ont rendu la personnalité trop sycophante et ennuyeuse (même s’il y a de très bonnes parties), et nous travaillons sur des correctifs dès que possible, certains aujourd’hui et certains cette semaine », a écrit Altman dans un article sur le plate-forme sociale x.
Mardi 29 avril, OpenAI a publié une déclaration qui a confirmé qu’une mise à jour de la semaine précédente avait été annulée et que les utilisateurs accédaient maintenant à une version précédente de Chatgpt, qui, selon la société, avait « un comportement plus équilibré ».
« La mise à jour que nous avons supprimée était trop flatteuse ou agréable – souvent décrite comme sycophantique », a déclaré Openai dans le communiqué.
La récente mise à jour d’OpenAI visait à améliorer la «personnalité» par défaut du modèle, qui est conçue pour être favorable et respectueuse des différentes valeurs humaines, selon le communiqué. Mais alors que l’entreprise essayait de rendre le chatbot plus intuitif, il est devenu trop favorable et a commencé à compléter excessivement ses utilisateurs.
La société a déclaré qu’elle façonne le comportement de ses modèles Chatgpt avec la ligne de base principes et les instructions, et a des signaux utilisateur, comme un système de pouce et de pouce, pour enseigner au modèle à appliquer ces principes. Les surveillants avec ce système de rétroaction étaient à blâmer pour les problèmes avec la dernière mise à jour, selon la déclaration.
« Dans cette mise à jour, nous nous sommes trop concentrés sur les commentaires à court terme et nous ne tenons pas pleinement compte de la façon dont les interactions des utilisateurs avec Chatgpt évoluent au fil du temps », a déclaré Openai. « En conséquence, le GPT-4O s’est assisté des réponses trop favorables mais fallacieuses. »