
OpenAI a peut-être violé la nouvelle loi californienne sur la sécurité de l’IA en publiant son dernier modèle de codage, affirme un groupe de surveillance de l’IA.
Les violations pourraient exposer l’entreprise à des millions de dollars d’amendes, et cette affaire pourrait constituer le premier test établissant un précédent pour les dispositions de la nouvelle loi.
Un porte-parole d’OpenAI a contesté la position de l’organisme de surveillance, déclarant à Fortune que l’entreprise est « confiante dans sa conformité avec la loi sur la sécurité des frontières, y compris le SB 53 ».
Cette controverse porte sur le dernier modèle de codage d’OpenAI, GPT-5.3-Codex, publié la semaine dernière. Le modèle fait partie des efforts d’OpenAI pour retrouver son leadership dans le codage basé sur l’IA, et les données de référence publiées par OpenAI montrent qu’il est nettement plus performant dans les tâches de codage que les versions précédentes du modèle d’OpenAI et de concurrents tels qu’Anthropic. Cependant, ce modèle a également soulevé des préoccupations sans précédent en matière de cybersécurité.
Le PDG Sam Altman a déclaré que le modèle est le premier à entrer dans la catégorie de risque « élevé » pour la cybersécurité dans le cadre de préparation de l’entreprise, un système interne de classification des risques qu’OpenAI utilise pour publier des modèles. Cela signifie qu’OpenAI le classe intrinsèquement comme un modèle doté de capacités de codage suffisantes pour faciliter des cyberattaques potentiellement importantes, en particulier lorsqu’il est automatisé ou utilisé à grande échelle.
Le projet Midas, un groupe de surveillance de l’IA, allègue qu’OpenAI n’a pas respecté ses engagements en matière de sécurité, qui sont actuellement juridiquement contraignants en vertu de la loi californienne, en lançant de nouveaux modèles à haut risque.
Le SB 53 de Californie, entré en vigueur en janvier, exige que les grandes sociétés d’IA publient et adhèrent à leurs propres cadres de sécurité détaillant comment leurs modèles préviennent les risques catastrophiques, définis comme des accidents causant 50 morts ou plus ou 1 milliard de dollars de dommages matériels. Il est également interdit à ces sociétés de faire des déclarations trompeuses concernant la conformité.
Le cadre de sécurité d’OpenAI nécessite des garanties spéciales pour les modèles présentant des risques de cybersécurité élevés, conçues pour empêcher l’IA de se comporter mal, de se comporter de manière trompeuse, d’interférer avec la recherche sur la sécurité ou de cacher de véritables fonctionnalités. Cependant, le projet Midas a déclaré qu’OpenAI ne semblait pas avoir mis en œuvre certaines mesures de protection contre le désalignement avant le déploiement, même si cela déclenchait un seuil de cybersécurité « à haut risque ».
OpenAI a déclaré que l’interprétation du projet Midas du langage du cadre de préparation était incorrecte, mais a également déclaré que le langage du cadre était « ambigu » et que l’entreprise avait tenté de clarifier l’intention du langage du cadre dans le rapport de sécurité qu’elle a publié avec GPT-5.3-Codex. OpenAI a déclaré dans son rapport de sécurité que des garanties supplémentaires ne sont nécessaires que lorsque des cyber-risques élevés surviennent « en conjonction avec » une autonomie à longue portée ou la capacité de fonctionner de manière indépendante pendant de longues périodes. La société a déclaré qu’elle pensait que GPT-5.3-Codex ne disposait pas de cette autonomie et qu’aucune mesure de protection n’était donc nécessaire.
« Bien que GPT-5.3-Codex ait terminé notre processus complet de tests et de gouvernance comme détaillé dans la carte système publiée, il n’a pas démontré de capacités d’autonomie à longue portée comme l’a confirmé le jugement d’experts internes, y compris le groupe consultatif sur la sécurité, sur la base d’évaluations par procuration », a déclaré le porte-parole. Cependant, la société a également déclaré que, comme il n’existe aucun moyen définitif d’évaluer l’autonomie à long terme d’un modèle, elle s’appuie sur des tests qui, selon elle, serviront d’indicateur pour cette mesure, tout en travaillant au développement de meilleures méthodes d’évaluation.
Cependant, certains chercheurs en sécurité contestent l’interprétation d’OpenAI. « Plutôt que d’admettre qu’ils n’ont pas suivi le plan ou ne l’ont pas mis à jour avant sa sortie, OpenAI semble dire que les normes sont ambiguës. Après avoir lu la documentation pertinente, cela ne me semble pas ambigu », a déclaré Nathan Calvin, vice-président des affaires nationales et avocat général d’Encode, dans un article sur X.
Le projet Midas affirme également qu’OpenAI ne peut pas prouver de manière concluante que le modèle précédent, moins avancé de l’entreprise, ne dispose pas de l’autonomie nécessaire pour des mesures supplémentaires, car il a déjà surpassé les références mondiales en matière d’exécution autonome de tâches. Le groupe soutient que même si les règles n’étaient pas claires, OpenAI aurait dû les clarifier avant de publier le modèle.
Le fondateur du projet Midas, Tyler Johnston, a déclaré à propos de la violation potentielle : « C’est particulièrement embarrassant compte tenu de la hauteur du plancher sur le tournage du SB 53. Fondamentalement, tout ce que vous avez à faire est de suivre le plan de sécurité volontaire que vous avez choisi, d’être honnête à ce sujet et de le modifier si nécessaire, mais ne le violez pas et ne mentez pas à ce sujet.
Si une enquête est ouverte et que les allégations s’avèrent exactes, le SB 53 autorise des amendes substantielles en cas de violation, qui pourraient atteindre des millions de dollars selon la gravité et la durée de la violation. Un représentant du bureau du procureur général de Californie a déclaré à Fortune que l’agence « s’engage à faire respecter les lois de l’État, y compris celles adoptées pour accroître la transparence et la sécurité dans le domaine émergent de l’IA ». Cependant, le ministère a déclaré qu’il ne pouvait ni confirmer ni infirmer aucun commentaire sur une enquête potentielle ou en cours.
Mis à jour le 10 février : cet article a été mis à jour pour déplacer la déclaration d’OpenAI selon laquelle elle estime se conformer à la California AI Act en haut de l’article. Le titre a également été modifié pour indiquer clairement qu’OpenAI conteste les allégations du groupe de surveillance. De plus, cet article a été mis à jour pour clarifier que les déclarations d’OpenAI dans le rapport de sécurité GPT-5.3-Codex visaient à clarifier ce que la société prétend être un langage ambigu dans son cadre de préparation.

