OpenAI a utilisé le Subdreddit, R / ChangeMyView, pour créer un test pour mesurer les capacités persuasives de ses modèles de raisonnement AI. La société a révélé cela dans un document de carte System-A surgissant comment un système d’IA fonctionne – qui a été publié avec son nouveau modèle de «raisonnement», O3-Minini, vendredi.
Des millions d’utilisateurs de Reddit sont membres de R / ChangeMyView, où ils publient des prises de vue en espérant lire d’autres points de vue sur un sujet. En responsable de ces prises chaudes, d’autres utilisateurs répondent avec des arguments persuasifs expliquant pourquoi l’affiche originale est erronée.
Le Subdredit est l’un des nombreux forums Reddit qui est basale une mine d’or pour les entreprises technologiques, comme OpenAI, qui veulent former des modèles d’IA sur des données générales de haute qualité et gérées par l’homme.
OpenAI dit qu’il collecte des publications d’utilisateurs de R / ChangeMyView et demande à ses modèles AI d’écrire des plis, dans un environnement fermé, qui changerait l’esprit de l’utilisateur de Reddit sur un sujet. La société montre ensuite les réponses aux testeurs, qui évaluent à quel point l’argument est persuasif, et Finully OpenAI compare la réponse des modèles d’IA à la réplification humaine pour ce même article.
Le ChatGPT-Maker a un accord de licence de contenu avec Reddit qui permet à OpenAI de s’entraîner sur les publications des utilisateurs de Reddit et d’afficher ces publications dans ses produits. Nous ne savons pas quel pays Openai pour ce contenu, mais Google aurait le pays de Reddit 60 millions de dollars par an dans le cadre d’une transaction similaire.
Cependant, Openai indique à TechCrunch que l’évaluation basée sur ChangeMyview n’est pas liée à son accord Reddit. On ne sait pas comment OpenAI a accédé aux données de la Sandredit, et la société affirme qu’elle n’a pas l’intention de publier cette évaluation au public.
Bien que la référence ChangeMyView d’OpenAI ne soit pas nouvelle – elle a également été utilisée pour évaluer l’O1 – elle souligne la valeur des données humaines précieuses pour les développeurs de modèles d’IA, ainsi que les façons troubles que les entreprises technologiques obtiennent des ensembles de données.
Reddit n’a pas lâché imminent à la demande de commentaires de TechCrunch.
Alors que Reddit a conclu quelques accords de licence sur l’IA, la société a également appelé plusieurs sociétés d’IA pour gratter son site sans payer. Le PDG de Reddit, Steve Huffman, a déclaré à The Verge l’année dernière que Microsoft, Anthropic et Perplexity avaient refusé de négocier avec lui et a déclaré que c’était «une vraie douleur dans le cul de bloquer ces entreprises.
Remarquement, OpenAI a été accusé dans plusieurs poursuites de gratter mal des sites Web, y compris le New York Times, pour obtenir plus de données de formation pour améliorer le chatppt et ses modèles d’IA sous-jacents.
En termes de performances sur le benchmark ChangeMyview, O3-Mini des ne appelle pas pour effectuer nocher mieux ou pire que O1 ou GPT-4O. Cependant, les derniers modèles d’IA d’OpenAI semblent être plus convaincants que la plupart des gens de la Suredit R / ChangeMyview.

« GPT-4O, O3-MINI et O1 démontrent tous des abilitités d’argumentation persuasives, dans le top 80-90e centile des humains », a déclaré Openai dans la carte système d’O3-MinI. » Humains ou performances surhumaines claires. »
L’objectif d’OpenAI n’est pas de créer des modèles d’IA hyper-personnels, mais plutôt pour s’assurer que les modèles d’IA ne deviennent pas trop convaincants. Les modèles de raisonnement sont devenus assez bons en matière de persuasion et de décession, donc Openai a développé de nouvelles évaluations et garanties pour l’ajouter.
La peur motivant ces tests de persuasion est qu’un modèle d’IA serait dangereux s’il était très bon pour persuader ses utilisateurs humains. Théoriquement, cela pourrait permettre à une IA avancée de poursuivre son propre agenda, ou l’ordre du jour de celui qui le contrôle.
Même après avoir gratté la majeure partie de l’Internet public et sauté à travers des cerceaux pour concéder à d’autres données, le Benchmark ChangeMyView montre comment les développeurs de modèles d’IA ont du mal à trouver des ensembles de données de haute qualité pour tester leurs modèles. Mais les obtenir est plus facile à dire que par conséquent.
TechCrunch a une newsletter axée sur l’IA! Inscrivez-vous ici pour l’obtenir dans votre boîte de réception tous les mercredis.