Reddit transpire anthropic pour avoir prétendument utilisé les données du site pour former des modèles d’IA sans un droit de licence approprié, selon la plainte déposée mercredi devant un tribunal de Californie du Nord. Reddit affirme dans la plainte que l’utilisation non autorisée par Anthropic des données du site à des fins commerciales était illégale, et AI le start-up AI vioé de Reddit Agmentation.
Le procès de Reddit en fait la première grande entreprise de technologie à défier légalement un fournisseur de modèles d’IA sur ses pratiques de données de formation, rejoignant une litanie d’éditeurs qui ont poursuivi des entreprises technologiques pour des raisons similaires.
Le New York Times a poursuivi Openai et Microsoft pour une formation sur ses articles de presse sans paiement ni autorisation. Pendant ce temps, Sarah Silverman et d’autres auteurs de livres ont poursuivi Meta pour la formation de modèles d’IA sur leurs livres sans approbation. Les éditeurs de musique et les artistes ont également des affirmations similaires contre des startups audio, vidéo et génération d’images de l’IA, alléguant une mauvaise utilisation de leur contenu.
« Nous ne tolérerons pas les entités à la recherche de profit comme Anthropic Exploiter commercialement Reddit pour des milliards de dollars sans aucun retour pour les Redditors ni respect pour leur vie privée », a déclaré Ben Lee, directeur juridique de Reddit, dans une déclaration à TechCrunch.
Notamment, Reddit a signé des accords avec d’autres fournisseurs de modèles d’IA, y compris OpenAI et Google, qui permettent à ces entreprises de former des modèles d’IA sur les données de Reddit et d’avoir les publications du site dans les réponses de leurs chatbots d’IA respectives. Cependant, dans le dossier, Reddit dit qu’il soumet OpenAI et Google à certains termes qui protègent les intérêts et la confidentialité de ses utilisateurs.
Sam Altman, le PDG d’Openai, détient une participation de 8,7% dans Reddit, faisant de lui le troisième actionnaire le plus lancé, et était autrefois membre du conseil d’administration de la société.
Dans le dossier, Reddit affirme qu’il a approché anthropic et a clairement indiqué que la startup d’IA n’avait pas l’autorisation de gratter ou d’utiliser le contenu de Reddit. Cependant, Reddit affirme que anthropique «a refusé de s’engager».
« Nous ne sommes pas d’accord avec les affirmations de Reddit et nous nous défendrons vigoureusement », a déclaré la porte-parole anthropique Danielle Ghighlieri dans un article envoyé par e-mail à TechCrunch.
Reddit affirme que dans sa plainte, les robots de gratte d’Anthropic ont ignoré les fichiers robots.txt du réseau social, une norme qui signale au système automatisé de ne pas craquer le site Web. La plate-forme communautaire en ligne allègue que, après qu’Anthropic ait prétendu empêcher ses robots de gratter Reddit en 2024, les bots d’Anthropic ont continué à gratter la plate-forme plus de 100 000 fois.
Reddit demande à Anthropic de payer des dommages-intérêts compensatoires, ainsi que par la restitution de l’amour par lequel Anthropic a été enrichi par le grattage du contenu de Reddit. Reddit demande également à une injonction interdisant à Anthropic de continuer à utiliser le contenu de Reddit.