Après avoir annoncé plus tôt cette année un cadre pour un écosystème d’IA ouvert, l’organisation à but non lucratif Creative Commons s’est prononcée en faveur de la technologie « pay-to-crawl » – un système permettant d’automatiser la rémunération du contenu d’un site Web lorsqu’il est consulté par des machines, comme les robots d’exploration Web IA.
Creative Commons (CC) est surtout connu pour être le fer de lance du mouvement des licences qui permet aux créateurs de partager leurs œuvres tout en conservant leurs droits d’auteur. En juillet, l’organisation a annoncé un projet visant à fournir un cadre juridique et technique pour le partage d’ensembles de données entre les entreprises qui contrôlent les données et les fournisseurs d’IA qui souhaitent s’y former.
Aujourd’hui, l’organisation à but non lucratif tente de soutenir les systèmes de paiement pour l’exploration, affirmant qu’elle « soutient prudemment ».
« Mis en œuvre de manière responsable, le paiement pour explorer pourrait représenter un moyen pour les sites Web de soutenir la création et le partage de leur contenu, et de gérer des utilisations de substitution, en gardant le contenu accessible au public là où il ne pourrait autrement pas être partagé ou disparaîtrait derrière des paywalls encore plus restrictifs », a déclaré un article du blog CC.
Menée par des sociétés comme Cloudflare, l’idée derrière le paiement pour l’exploration serait de facturer les robots IA chaque fois qu’ils explorent un site pour collecter son contenu pour la formation et les mises à jour du modèle.
Dans le passé, les sites Web permettaient librement aux robots d’indexation d’indexer leur contenu afin de l’inclure dans les moteurs de recherche comme Google. Ils ont bénéficié de cet arrangement en voyant leurs sites répertoriés dans les résultats de recherche, ce qui a généré des visiteurs et des clics. Cependant, avec la technologie de l’IA, la dynamique a changé. Une fois qu’un consommateur a obtenu sa réponse via un chatbot IA, il est peu probable qu’il clique sur la source.
Ce changement a déjà été dévastateur pour les éditeurs en tuant le trafic de recherche, et il ne montre aucun signe de ralentissement.
Un système de paiement pour l’exploration, en revanche, pourrait aider les éditeurs à se remettre du coup que l’IA a eu sur leurs résultats. De plus, cela pourrait mieux fonctionner pour les petits éditeurs Web qui n’ont pas la possibilité de négocier des accords de contenu ponctuels avec les fournisseurs d’IA. Des accords majeurs ont été conclus entre des sociétés comme OpenAI et Condé Nast, Axel Springer et d’autres ; ainsi qu’entre Perplexity et Gannett ; Amazon et le New York Times ; et Meta et divers éditeurs de médias, entre autres.
CC a émis plusieurs réserves quant à son soutien au paiement pour l’exploration, soulignant que de tels systèmes pourraient concentrer le pouvoir sur le Web. Cela pourrait également potentiellement bloquer l’accès au contenu pour « les chercheurs, les organisations à but non lucratif, les institutions du patrimoine culturel, les éducateurs et autres acteurs travaillant dans l’intérêt public ».
Il suggère une série de principes pour un paiement pour l’exploration responsable, notamment le fait de ne pas faire du paiement pour l’exploration un paramètre par défaut pour tous les sites Web et d’éviter les règles générales pour le Web. En outre, il a déclaré que les systèmes d’exploration payants devraient permettre une limitation, pas seulement un blocage, et devraient préserver l’accès de l’intérêt public. Ils doivent également être ouverts, interopérables et construits avec des composants standardisés.
Cloudflare n’est pas la seule entreprise à investir dans le domaine du paiement à l’exploration.
Microsoft crée également un marché de l’IA pour les éditeurs, et de plus petites startups comme ProRata.ai et TollBit ont également commencé à le faire. Un autre groupe appelé RSL Collective a annoncé ses propres spécifications pour une nouvelle norme appelée Really Simple Licensing (RSL) qui dicterait à quelles parties d’un site Web les robots d’exploration pourraient accéder, mais ne bloquerait pas réellement les robots d’exploration. Cloudflare, Akamai et Fastly ont depuis adopté RSL, soutenu par Yahoo, Ziff Davis, O’Reilly Media et d’autres.
CC faisait également partie de ceux qui ont annoncé son soutien à RSL, aux côtés de CC Signals, son projet plus large visant à développer des technologies et des outils pour l’ère de l’IA.

