
L’investissement d’un milliard de dollars de Disney dans OpenAI a été annoncé jeudi matin et la décision d’intégrer plus de 200 personnages Disney, Pixar, Marvel et Star Wars dans le générateur vidéo Sora est plus qu’un simple accord de licence. Matthew Sugg, un expert en droit du droit d’auteur et en IA qui enseigne à la faculté de droit de l’Université Emory, a déclaré que l’accord signale un réalignement stratégique qui pourrait remodeler la façon dont Hollywood protège la propriété intellectuelle face au contenu généré par l’IA qui menace d’éroder sa magie légalement protégée.
« Les sociétés d’IA se trouvent désormais dans une situation où elles doivent soit filtrer de manière proactive les invites des utilisateurs et modéliser leur sortie pour éviter de montrer accidentellement Dark Vador, soit conclure des contrats avec les détenteurs de droits pour obtenir l’autorisation de créer des vidéos et des images de Dark Vador », a déclaré Sugg à Fortune. « La stratégie de licence est bien plus gagnant-gagnant. »
L’accord de trois ans donne à OpenAI le droit d’intégrer des centaines de personnages appartenant à Disney dans Sora et ChatGPT Image. Disney a également acquis des bons de souscription d’actions pour devenir un client majeur d’OpenAI et prévoit de mettre en œuvre ChatGPT en interne.
Sugg a déclaré que l’accord lui-même serait une sorte de « partage de revenus ».
« OpenAI n’a pas encore compris le modèle de revenus », a déclaré Sugg. « Je pense donc que cela simplifie les choses d’une certaine manière en en faisant simplement un accord d’investissement. Pour Disney… (OpenAI) trouvera un moyen de monétiser cela à un moment donné, et (Disney) en obtiendra une part. »
Pourquoi cet accord est important : « Le problème Snoopy »
Depuis plus d’un an, la plus grande menace juridique pesant sur l’IA générative à grande échelle se concentre sur ce que Sugg appelle le « problème Snoopy ». Cela signifie qu’il est extrêmement difficile de former des modèles génératifs forts sans un certain degré de mémorisation, et les personnages protégés par le droit d’auteur sont particulièrement vulnérables car ils sont protégés dans l’abstrait.
M. Sugg a soigneusement expliqué les différences importantes. Les sociétés d’IA n’accordent pas de licence pour former des œuvres protégées par le droit d’auteur. Ils accordent sous licence le droit de créer des produits qui, autrement, constitueraient une violation.
En effet, les affirmations selon lesquelles les sociétés d’IA entraînent leurs modèles sur du contenu sans licence sont « très fortes », a déclaré Sugg. Deux récentes décisions de justice dans les affaires Anthropic et Meta renforcent ces affirmations.
Selon Sugg, le véritable obstacle est toujours le résultat, et non la formation. Les défenses de l’usage équitable commencent à s’effilocher lorsqu’un modèle peut accidentellement produire des montures qui ressemblent trop à Dark Vador, Homer Simpson, Snoopy ou Elsa.
« Si vous mémorisez trop et que cette mémorisation affecte votre résultat, le cas d’utilisation équitable commence à s’effondrer », explique Sugg.
Bien qu’il soit impossible d’obtenir sous licence suffisamment de texte pour former un LLM (selon Sugg, « cela prendrait un milliard de transactions »), avec le bon partenaire, il est possible de créer un modèle d’image ou de vidéo entièrement à partir de données sous licence. C’est pourquoi les offres comme celles de Disney sont importantes. Des accords comme celui de Disney transforment des productions auparavant illégales en productions légales, que le processus de formation lui-même soit ou non qualifié d’usage équitable.
« Le principe limitant sera essentiellement de savoir si ces modèles reproduisent une partie significative du travail à partir des données d’entraînement dans le cadre des opérations quotidiennes », a déclaré Sugg.
Sugg a déclaré que l’accord constituait également une protection contre les poursuites judiciaires à Hollywood. L’annonce est « très mauvaise » pour Midjourney, qui poursuit Disney pour violation du droit d’auteur parce qu’il maintient son accord de licence avec OpenAI comme référence « responsable » pour les entreprises d’IA.
C’est aussi un signal sur l’avenir des données de l’IA
Au-delà des risques liés aux droits d’auteur, cet accord met en évidence une autre tendance : l’épuisement des données de haute qualité et sans licence sur l’Internet public.
Sugg a écrit dans un article de blog :
« Le fruit le plus accessible d’un Internet public a été arraché », a-t-il écrit. « Pour que des entreprises comme OpenAI s’améliorent, elles auront besoin d’accéder à des données que personne d’autre n’a. Google a YouTube et OpenAI a maintenant Magic Kingdom. »
C’est là le point crucial de ce qu’il appelle la « théorie de la rareté des données ». Le prochain bond en avant dans la qualité des modèles pour OpenAI pourrait nécessiter des partenariats de contenu exclusifs plutôt que davantage de scraping.
« En se connectant avec certains des plus grands détenteurs de propriété intellectuelle au monde, OpenAI s’est rendu indispensable à l’industrie même qui menaçait de l’anéantir par des litiges », a écrit Sugg.
AI et Hollywood sont engagés dans une guerre froide depuis trois ans à propos des données de formation, des droits à l’image et des violations des droits. Avec l’investissement d’un milliard de dollars de Disney, cette époque semble toucher à sa fin.
« C’est un modèle pour l’avenir », a écrit Sugg. « Nous nous éloignons d’une guerre totale entre l’IA et le contenu et nous dirigeons vers une division négociée du monde. »

