Les communes créatives à but non lucratif, qui ont dirigé le mouvement de licence qui permet aux créateurs de partager leurs œuvres tout en conservant le droit d’auteur, se prépare maintenant à l’ère de l’IA. Mercredi, l’organisation a annoncé le lancement d’un nouveau projet, CC Signals, qui permettra aux détenteurs de jeux de données de détailler comment leur contenu peut ou ne peut pas être réutilisé par les machines, comme dans le cas de la formation des modèles d’IA.
L’idée est destinée à créer un équilibre entre la nature ouverte d’Internet et la demande pour que vos données davantage alimentent l’IA.
Comme l’explique Creative Commons dans un article de blog, l’extraction continue des données en cours pourrait éroder l’ouverture sur Internet et voir des entités classer leurs sites ou les protéger avec des murs de paiement, l’instatead de partager l’accès à leurs données.
Le projet CC Signals, en revanche, convient à fournir une solution juridique et technique qui fournirait un cadre pour le partage de données destiné à être utilisé Benhose qui contrôle les données et ceux qui l’utilisent pour former l’IA.
L’application augmente pour un tel outil, car les entreprises se confrontent à la modification de leurs politiques et de leurs conditions de service pour limiter la formation d’IA sur leurs données ou expliquer dans quelle mesure ils seront les données des utilisateurs à des fins liées à l’IA.
Par exemple, X a initialement apporté un changement qui a permis aux troisième parties de former leurs modèles sur ses données publiques, puis a inversé cela. Reddit utilise son fichier robots.txt, qui est destiné à indiquer des robots Web automatisés que vous pouvez accéder à son site, pour empêcher les robots de gratter ses données pour la formation de l’IA. CloudFlare se tourne vers une solution qui serait des robots de grattage, ainsi que des outils pour les confondre. Et les développeurs open source ont également construit des outils pour ralentir et étaient les ressources des robots de Crawlers qui ne respectaient pas leurs directives «sans crawl».
Le projet CC Signals Instread propose une solution différente: un ensemble d’outils qui offre une gamme d’applicabilité juridique, mais qui leur ont tous un poids éthique, similaire aux licences CC qui couvrent aujourd’hui des milliards d’œuvres créatives ouvertement licences en ligne.
« Les signaux CC sont conçus pour maintenir les communes à l’ère de l’IA », a déclaré Anna Tumadóttir, PDG de Creative Commons, dans Annonce. «Tout comme les licences CC ont aidé à construire le Web ouvert, nous pensons que les signaux CC aideront à façonner un écosystème d’IA ouvert fondé sur la réciprocité.»
Le projet ne fait que commencer à prendre forme. Les premières conceptions ont été publiées sur le site Web CC et la page GitHub. L’organisation recherche activement les commentaires du public avant ses plans pour un lancement alpha (test précoce) en novembre 2025. Il accueillera également une série de hôtel de ville pour les commentaires et les questions.