Openai a utilisé ce subreddit pour tester la persuasion de l'IA

OpenAI a utilisé le Subdreddit, R / ChangeMyView, pour créer un test pour mesurer les capacités persuasives de ses modèles de raisonnement AI. La société a révélé cela dans un document de carte System-A surgissant comment un système d’IA fonctionne – qui a été publié avec son nouveau modèle de «raisonnement», O3-Minini, vendredi.

Des millions d’utilisateurs de Reddit sont membres de R / ChangeMyView, où ils publient des prises de vue en espérant lire d’autres points de vue sur un sujet. En responsable de ces prises chaudes, d’autres utilisateurs répondent avec des arguments persuasifs expliquant pourquoi l’affiche originale est erronée.

Le Subdredit est l’un des nombreux forums Reddit qui est basale une mine d’or pour les entreprises technologiques, comme OpenAI, qui veulent former des modèles d’IA sur des données générales de haute qualité et gérées par l’homme.

OpenAI dit qu’il collecte des publications d’utilisateurs de R / ChangeMyView et demande à ses modèles AI d’écrire des plis, dans un environnement fermé, qui changerait l’esprit de l’utilisateur de Reddit sur un sujet. La société montre ensuite les réponses aux testeurs, qui évaluent à quel point l’argument est persuasif, et Finully OpenAI compare la réponse des modèles d’IA à la réplification humaine pour ce même article.

Le ChatGPT-Maker a un accord de licence de contenu avec Reddit qui permet à OpenAI de s’entraîner sur les publications des utilisateurs de Reddit et d’afficher ces publications dans ses produits. Nous ne savons pas quel pays Openai pour ce contenu, mais Google aurait le pays de Reddit 60 millions de dollars par an dans le cadre d’une transaction similaire.

Cependant, Openai indique à TechCrunch que l’évaluation basée sur ChangeMyview n’est pas liée à son accord Reddit. On ne sait pas comment OpenAI a accédé aux données de la Sandredit, et la société affirme qu’elle n’a pas l’intention de publier cette évaluation au public.

Bien que la référence ChangeMyView d’OpenAI ne soit pas nouvelle – elle a également été utilisée pour évaluer l’O1 – elle souligne la valeur des données humaines précieuses pour les développeurs de modèles d’IA, ainsi que les façons troubles que les entreprises technologiques obtiennent des ensembles de données.

Reddit n’a pas lâché imminent à la demande de commentaires de TechCrunch.

Alors que Reddit a conclu quelques accords de licence sur l’IA, la société a également appelé plusieurs sociétés d’IA pour gratter son site sans payer. Le PDG de Reddit, Steve Huffman, a déclaré à The Verge l’année dernière que Microsoft, Anthropic et Perplexity avaient refusé de négocier avec lui et a déclaré que c’était «une vraie douleur dans le cul de bloquer ces entreprises.

Remarquement, OpenAI a été accusé dans plusieurs poursuites de gratter mal des sites Web, y compris le New York Times, pour obtenir plus de données de formation pour améliorer le chatppt et ses modèles d’IA sous-jacents.

En termes de performances sur le benchmark ChangeMyview, O3-Mini des ne appelle pas pour effectuer nocher mieux ou pire que O1 ou GPT-4O. Cependant, les derniers modèles d’IA d’OpenAI semblent être plus convaincants que la plupart des gens de la Suredit R / ChangeMyview.

« GPT-4O, O3-MINI et O1 démontrent tous des abilitités d’argumentation persuasives, dans le top 80-90e centile des humains », a déclaré Openai dans la carte système d’O3-MinI. » Humains ou performances surhumaines claires. »

L’objectif d’OpenAI n’est pas de créer des modèles d’IA hyper-personnels, mais plutôt pour s’assurer que les modèles d’IA ne deviennent pas trop convaincants. Les modèles de raisonnement sont devenus assez bons en matière de persuasion et de décession, donc Openai a développé de nouvelles évaluations et garanties pour l’ajouter.

La peur motivant ces tests de persuasion est qu’un modèle d’IA serait dangereux s’il était très bon pour persuader ses utilisateurs humains. Théoriquement, cela pourrait permettre à une IA avancée de poursuivre son propre agenda, ou l’ordre du jour de celui qui le contrôle.

Même après avoir gratté la majeure partie de l’Internet public et sauté à travers des cerceaux pour concéder à d’autres données, le Benchmark ChangeMyView montre comment les développeurs de modèles d’IA ont du mal à trouver des ensembles de données de haute qualité pour tester leurs modèles. Mais les obtenir est plus facile à dire que par conséquent.

TechCrunch a une newsletter axée sur l’IA! Inscrivez-vous ici pour l’obtenir dans votre boîte de réception tous les mercredis.

Source link

What's Hot

How Lumen Technologies is using AI to help cut $1 billion in network costs

Facebook lance un nouveau programme de monétisation pour attirer les créateurs populaires de TikTok et YouTube

« Courbe de trajectoire » : la construction de centres de données aux États-Unis est bloquée en raison des limitations du réseau électrique

Openai a utilisé ce subreddit pour tester la persuasion de l’IA

Facebook lance un nouveau programme de monétisation pour attirer les créateurs populaires de TikTok et YouTube

Marquis affirme que plus de 672 000 personnes se sont vu voler des données personnelles et financières lors d’une attaque de ransomware

Le DOD affirme que les « lignes rouges » d’Anthropic en font un « risque inacceptable pour la sécurité nationale »

Mave Health vise à améliorer l’attention et l’humeur avec son casque stimulant le cerveau

XTransfer CSO prend la parole au Inclusive FinTech Forum 2026 au Rwanda

Comment l’IA remodèle l’infrastructure de base de la fintech

Comment les plus grandes entreprises fintech d’Afrique réinventent le récit des « femmes dans la technologie »

Top Insights

How Lumen Technologies is using AI to help cut $1 billion in network costs

Facebook lance un nouveau programme de monétisation pour attirer les créateurs populaires de TikTok et YouTube

« Courbe de trajectoire » : la construction de centres de données aux États-Unis est bloquée en raison des limitations du réseau électrique

What's Hot

Openai a utilisé ce subreddit pour tester la persuasion de l’IA

Related Posts

Subscribe to Updates