OpenAI a mis à jour son cadre de préparation – le système interne qu’il utilise pour évaluer la sécurité des modèles d’IA et déterminer les garanties nécessaires pendant le développement et le déploiement. Dans la mise à jour, OpenAI a déclaré qu’il pouvait «ajuster» ses exigences de sécurité si un laboratoire AI concurrent libère un système «à haut risque» sans protection similaire en place.
Le changement reflète les pressions concurrentielles croissantes sur les développeurs d’IA commerciaux pour déployer rapidement les modèles. OpenAI a Ben a engagé la réduction des normes de sécurité en faveur d’un côté plus rapide et de ne pas livrer des rapports en temps opportun détaillant ses tests de sécurité. La semaine dernière, 12 employés de Train OpenAI ont déposé un mémoire dans le cas d’Elon Musk contre OpenAI, faisant valoir que la société serait encouragée à réduire et plus de coins sur la sécurité si elle terminait sa restructuration d’entreprise prévue.
Peut-être anticipant la critique, Openai affirme qu’il ne rendrait pas ces ajustements politiques à la légère et qu’il connaîtrait ses garanties à «un niveau plus protecteur.
« Si un autre développeur de l’IA de Frontier a publié un système à haut risque avec des garanties comparables, nous pouvons additionner nos exigences », a écrit Openai dans un article de blog publié mardi après-midi. « Cependant, nous confirmerions d’abord rigoureusement que Risk Landscape a effectivement changé, reconnaissant publiquement que nous faisons un ajustement, évaluons que l’ajustement n’augmente pas de manière significative le risque global de préjudice grave et maintient toujours la protection de la protection. »
Le cadre de préparation actualisé indique également clairement qu’Openai s’appuie plus sur les évaluations automatisées pour accélérer le développement de produits. La société affirme que même si elle a complètement abandonné les tests dirigés par l’homme, il a construit «une suite croissante d’évaluations automatisées» qui peuvent supposer «suivre (a) une cadence plus rapide (libération)».
Certains rapports contredisent cela. Selon le Financial Times, OpenAI a donné aux testeurs moins d’une semaine pour les contrôles de sécurité pour un prochain modèle majeur – un calendrier comprimé par rapport aux versions précédentes. Les sources de la publication ont également allégué que de nombreux tests de sécurité d’Openai sont maintenant effectués sur des versions antérieures de modèles plutôt que le public publié.
Dans les déclarations, OpenAI a contesté la notion qui compromet la sécurité.
Openai réduit tranquillement ses engagements de sécurité.
Omis de la liste des changements du cadre de préparation d’Openai:
Ne nécessitant plus de tests de sécurité des modèles Finetuned https://t.co/otmeiatsjs
– Steven Adler (@sjgadler) 15 avril 2025
D’autres modifications du cadre d’OpenAI parrain à la façon dont l’entreprise classe les modèles en fonction du risque, y compris des modèles qui peuvent cacher leurs capacités, échapper aux garanties, empêcher leur fermeture et même s’auto-se répandre. Openai dit qu’il se concentrera désormais sur le fait que les modèles répondent à l’un des deux seuils: une capacité «élevée» ou une capacité «critique».
La définition d’OpenAI du formulaire est un modèle qui pourrait «amplifier les voies existantes vers des dommages graves». Les derniers sont des modèles qui «introduisent une nouvelle voie précédente vers de graves dommages», selon l’entreprise.
« Les systèmes couverts qui atteignent une capacité élevée doivent avoir des garanties qui minimisent suffisamment le risque associé de préjudice grave avant leur déploiement », a écrit Openai dans son article de blog. «Les systèmes qui atteignent la capacité critique nécessitent également des garanties qui minimisent suffisamment les risques associés pendant le développement.»
Les mises à jour sont le premier OpenAI a fait le cadre de préparation depuis 2023.

