OpenAI met à jour l’opérateur d’alimentation du modèle AI, son agent AI qui peut parcourir automatiquement le Web et utiliser certains logiciels dans une machine virtuelle hébergée par le cloud pour répondre aux demandes des utilisateurs.
Bientôt, l’opérateur utilisera un modèle basé sur O3, l’un des derniers modèles O d’Openai de «raisonnement». Auparavant, l’opérateur s’est appuyé sur la version personnalisée de GPT-4O.
Par de nombreux repères, l’O3 est un modèle beaucoup plus avancé, en particulier sur les tâches impliquant les mathématiques et le raisonnement.
« Nous remplaçons le modèle existant basé sur GPT-4 pour l’opérateur par une version basée sur OpenAI O3 », a écrit Openai dans un article de blog. «La version API (de l’opérateur) restera basée sur 4O.»
L’opérateur est l’un des nombreux outils agents publiés par les sociétés d’IA ces derniers mois. Les entreprises courent pour rendre les connexions très sophistiquées qui peuvent être connectées pour effectuer des tâches plus moins avec une supervision.
Google propose un agent «Utilisation d’ordinateurs» via son API Gemini qui peut parcourir de manière similaire le Web et prendre des mesures au nom des utilisateurs, ainsi qu’une offre plus axée sur le consommateur appelé Mariner. Les modèles d’Anthropic sont également en mesure d’effectuer des tâches informatiques, notamment l’ouverture des fichiers et la navigation sur les pages Web.
Selon OpenAI, le nouveau modèle d’opérateur, appelé opérateur O3, a été «affiné avec des données de sécurité supplémentaires pour l’utilisation de l’ordinateur», y compris des ensembles de données conçus pour «enseigner les limites de décision du modèle (OpenAI) sur les confes et les refus».
OpenAI a publié un rapport technique montrant les performances de l’opérateur O3 sur des évaluations de sécurité spécifiques. Par rapport au modèle d’opérateur GPT-4O, l’opérateur O3 a moins comme refuser d’effectuer des activités «illicites» et de rechercher des données personnelles sensibles, et moins susceptible d’une forme d’attaque d’IA connue sous le nom d’injection rapide, selon le rapport technique.
« O3 Operator utilise la même approche multi-loyée de la sécurité que nous avons utilisée pour la version 4O de l’opérateur », a écrit Openai dans son article de blog. «Bien que l’opérateur O3 hérite des capacités de codage d’O3, il n’a pas accès natif à un codage ou à un terminal ou un terminal.»

