Close Menu
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
What's Hot

Les ennemis Donald Trump et Elon Musk sont-ils maintenant?

juin 6, 2025

La banque centrale de la Russie réduit les taux d’intérêt pour la première fois depuis 2022

juin 6, 2025

Pourquoi Genai est «l’archéologue d’entreprise» dont chaque entreprise a besoin

juin 6, 2025
Facebook X (Twitter) Instagram
Facebook X (Twitter) Instagram
221 France221 France
  • Home
  • Fintech
  • Economy
  • Fashion
  • Latest
  • Lifestyle
  • Invest
  • Remote work
  • Startups
  • Tech
  • Business
221 France221 France
Home » Openai a utilisé ce subreddit pour tester la persuasion de l’IA
Startups

Openai a utilisé ce subreddit pour tester la persuasion de l’IA

JohnBy Johnjanvier 31, 2025Aucun commentaire4 Mins Read
Facebook Twitter Pinterest Reddit Telegram LinkedIn Tumblr VKontakte WhatsApp Email
Share
Facebook Twitter Reddit Pinterest Email


OpenAI a utilisé le Subdreddit, R / ChangeMyView, pour créer un test pour mesurer les capacités persuasives de ses modèles de raisonnement AI. La société a révélé cela dans un document de carte System-A surgissant comment un système d’IA fonctionne – qui a été publié avec son nouveau modèle de «raisonnement», O3-Minini, vendredi.

Des millions d’utilisateurs de Reddit sont membres de R / ChangeMyView, où ils publient des prises de vue en espérant lire d’autres points de vue sur un sujet. En responsable de ces prises chaudes, d’autres utilisateurs répondent avec des arguments persuasifs expliquant pourquoi l’affiche originale est erronée.

Le Subdredit est l’un des nombreux forums Reddit qui est basale une mine d’or pour les entreprises technologiques, comme OpenAI, qui veulent former des modèles d’IA sur des données générales de haute qualité et gérées par l’homme.

OpenAI dit qu’il collecte des publications d’utilisateurs de R / ChangeMyView et demande à ses modèles AI d’écrire des plis, dans un environnement fermé, qui changerait l’esprit de l’utilisateur de Reddit sur un sujet. La société montre ensuite les réponses aux testeurs, qui évaluent à quel point l’argument est persuasif, et Finully OpenAI compare la réponse des modèles d’IA à la réplification humaine pour ce même article.

Le ChatGPT-Maker a un accord de licence de contenu avec Reddit qui permet à OpenAI de s’entraîner sur les publications des utilisateurs de Reddit et d’afficher ces publications dans ses produits. Nous ne savons pas quel pays Openai pour ce contenu, mais Google aurait le pays de Reddit 60 millions de dollars par an dans le cadre d’une transaction similaire.

Cependant, Openai indique à TechCrunch que l’évaluation basée sur ChangeMyview n’est pas liée à son accord Reddit. On ne sait pas comment OpenAI a accédé aux données de la Sandredit, et la société affirme qu’elle n’a pas l’intention de publier cette évaluation au public.

Bien que la référence ChangeMyView d’OpenAI ne soit pas nouvelle – elle a également été utilisée pour évaluer l’O1 – elle souligne la valeur des données humaines précieuses pour les développeurs de modèles d’IA, ainsi que les façons troubles que les entreprises technologiques obtiennent des ensembles de données.

Reddit n’a pas lâché imminent à la demande de commentaires de TechCrunch.

Alors que Reddit a conclu quelques accords de licence sur l’IA, la société a également appelé plusieurs sociétés d’IA pour gratter son site sans payer. Le PDG de Reddit, Steve Huffman, a déclaré à The Verge l’année dernière que Microsoft, Anthropic et Perplexity avaient refusé de négocier avec lui et a déclaré que c’était «une vraie douleur dans le cul de bloquer ces entreprises.

Remarquement, OpenAI a été accusé dans plusieurs poursuites de gratter mal des sites Web, y compris le New York Times, pour obtenir plus de données de formation pour améliorer le chatppt et ses modèles d’IA sous-jacents.

En termes de performances sur le benchmark ChangeMyview, O3-Mini des ne appelle pas pour effectuer nocher mieux ou pire que O1 ou GPT-4O. Cependant, les derniers modèles d’IA d’OpenAI semblent être plus convaincants que la plupart des gens de la Suredit R / ChangeMyview.

Crédits d’image: Openai

« GPT-4O, O3-MINI et O1 démontrent tous des abilitités d’argumentation persuasives, dans le top 80-90e centile des humains », a déclaré Openai dans la carte système d’O3-MinI.  » Humains ou performances surhumaines claires. »

L’objectif d’OpenAI n’est pas de créer des modèles d’IA hyper-personnels, mais plutôt pour s’assurer que les modèles d’IA ne deviennent pas trop convaincants. Les modèles de raisonnement sont devenus assez bons en matière de persuasion et de décession, donc Openai a développé de nouvelles évaluations et garanties pour l’ajouter.

La peur motivant ces tests de persuasion est qu’un modèle d’IA serait dangereux s’il était très bon pour persuader ses utilisateurs humains. Théoriquement, cela pourrait permettre à une IA avancée de poursuivre son propre agenda, ou l’ordre du jour de celui qui le contrôle.

Même après avoir gratté la majeure partie de l’Internet public et sauté à travers des cerceaux pour concéder à d’autres données, le Benchmark ChangeMyView montre comment les développeurs de modèles d’IA ont du mal à trouver des ensembles de données de haute qualité pour tester leurs modèles. Mais les obtenir est plus facile à dire que par conséquent.

TechCrunch a une newsletter axée sur l’IA! Inscrivez-vous ici pour l’obtenir dans votre boîte de réception tous les mercredis.



Source link

Share. Facebook Twitter Pinterest LinkedIn Reddit Email
Previous ArticleSam Altman: Openai a été du «mauvais côté de l’histoire» concernant l’open source
Next Article Ancien officier de la Réserve fédérale accusé d’avoir réussi des secrets en Chine
John
  • Website

Related Posts

Le tribunal refuse la demande d’Apple de mettre en pause la décision sur les frais de paiement de l’App Store

juin 6, 2025

Comment les startups de l’IA mènent la bataille contre les attaques sophistiquées de phistenance

juin 6, 2025

Comment choisir le meilleur logiciel de base de connaissances pour votre entreprise

juin 6, 2025

L’évaluation de 9,9 milliards de dollars du curseur NABS NABS, s’évanouit de 500 millions de dollars

juin 5, 2025
Add A Comment
Leave A Reply Cancel Reply

Top Posts

FinTech et Neobanks poussent les banques à repenser l’avenir des dépôts

juin 5, 2025

UK Fintechwise se tourne vers le marché américain pour promouvoir ses ambitions mondiales

juin 5, 2025

La technologie héritée afflige toujours 95% de la banque Asie-Pacifique, ralentissant la modernisation

juin 5, 2025

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

Bienvenue sur 221 France, votre source d’informations de qualité sur les domaines de la technologie, des affaires, du lifestyle et des animaux de compagnie. Nous sommes passionnés par la création de contenus qui enrichissent votre quotidien et vous aident à naviguer dans un monde en constante évolution.

Facebook X (Twitter) Instagram Pinterest YouTube
Top Insights

Les ennemis Donald Trump et Elon Musk sont-ils maintenant?

juin 6, 2025

La banque centrale de la Russie réduit les taux d’intérêt pour la première fois depuis 2022

juin 6, 2025

Pourquoi Genai est «l’archéologue d’entreprise» dont chaque entreprise a besoin

juin 6, 2025
Get Informed

Subscribe to Updates

Subscribe to our newsletter and never miss our latest news

Subscribe my Newsletter for New Posts & tips Let's stay updated!

© 2025 221france. Designed by 221france.
  • Home
  • About us
  • Advertise us
  • Contact us
  • DMCA
  • Privacy policy
  • Terms & Condition

Type above and press Enter to search. Press Esc to cancel.