Cette semaine, Sakana AI, une startup soutenue par Nvidia qui a collecté des centaines de millions de dollars des entreprises de VC, a fait une remarque. La société a déclaré avoir créé un système d’IA, l’ingénieur AI CUDA, qui pourrait efficacement accélérer la formation de certains modèles d’IA d’un facteur allant jusqu’à 100x.
Le seul problème est que le système n’a pas fonctionné.
Les utilisateurs de X ont rapidement découvert que le système de Sakana aboutit en fait à des performances de formation de modèle plus pires. Selon une utilisation, l’IA de Sakana entraîne un ralentissement 3X – pas une accélération.
Qu’est-ce qui ne va pas? Un bogue dans le code, selon le poste de Lucas Beyer, membre du personnel technique d’Openai.
« Leur code d’origine est mal de manière subtile », a écrit Beyer sur X. « Le fait qu’ils dirigent une analyse comparative deux fois avec des résultats extrêmement différents devraient les faire s’arrêter et réfléchir. »
Dans un post-mortem publié vendredi, Sakana a admis que le système avait trouvé un moyen de «tricher» (comme Sakana l’a décrit) et de noir la tendance du système à «récompenser le piratage» – c’est-à-dire identifier les défauts pour atteindre des métriques élevées sans accomplir le modèle de but souhaité up souhaité entraînement). Des phénomènes similaires ont été observés dans l’IA qui est formé pour jouer à des jeux d’échecs.
Selon Sakana, le système a trouvé des exploits dans le code d’évaluation que la société utilisait qui lui a permis de contourner les validations pour l’exactitude, entre autres chèques. Sakana dit qu’il a ajouté le problème et qu’il a l’intention de réviser ses affirmations dans les documents mis à jour.
« Nous avons sincère que les profils d’évaluation et d’exécution exploitent plus robustes pour éliminer bon nombre de ces lopopholes (sic) », a écrit la société dans le X Post. «Nous sommes en train de réviser notre article et nos résultats, pour refléter et discuter des effets (…), nous nous excusons profondément pour notre surveillance à nos lecteurs. Nous fournirons bientôt une révision de ce travail et discuterons dans les apprentissages. «
Accessoires à Sakana pour avoir possédé l’erreur. Mais l’épisode est un bon rappel que si une affirmation semble trop belle pour être vraie, surtout dans l’IA, c’est probablement le cas.