
Assis à côté du pape Léon XIV, qui livrait sa première encyclique sur les dangers de l’IA, se trouvait un conférencier intéressant, athée autoproclamé et milliardaire qui a cofondé l’une des sociétés d’IA les plus précieuses au monde.
Chris Olah, un éminent chercheur en sécurité de l’IA et l’un des cofondateurs d’Anthropic et directeur de la recherche sur l’interprétabilité de l’entreprise, a reconnu le caractère unique de son existence lors d’une présentation au Vatican la semaine dernière.
« Je veux commencer par quelque chose qui peut paraître étrange de la part d’un co-fondateur d’une société d’IA », a-t-il déclaré dans un discours préparé. Oler a déclaré que pour maintenir leur rentabilité et diriger la recherche tout en évitant les pressions géopolitiques, les entreprises d’IA doivent être sûres qu’elles « font la bonne chose » tout en continuant à stimuler l’innovation.
« Peu importe avec quelle sincérité chacun d’entre nous essaie de faire ce qu’il faut, et je crois que beaucoup d’entre nous le font, nous serons toujours influencés par ces incitations », a-t-il déclaré dans un discours préparé.
En raison du conflit entre la création d’une entreprise d’IA d’avant-garde et l’adhésion à une mission fondée sur des valeurs, Oller s’est assis à côté du pape Léon XIV et a averti que les critiques extérieurs, non seulement l’Église catholique mais aussi les universitaires et les gouvernements, devaient superviser l’industrie et mettre ses impératifs moraux au premier plan.
« Certains pourraient croire que les problèmes d’IA sont mieux traités par des informaticiens comme moi », a-t-il ajouté dans son discours. « Ils ont tort. »
Qui est Chris Ora?
La venue d’Oller au Vatican était aussi improbable que le voyage qui l’y a conduit.
Oller, qui a grandi à Toronto, au Canada, était un « fervent chrétien évangélique » jusqu’à ce qu’il devienne athée à l’âge de 15 ans. Il a fréquenté l’Université de Toronto pour étudier les mathématiques, mais a abandonné ses études après seulement un an.
Un an plus tard, en 2012, il a reçu 100 000 $ grâce à la bourse Thiel. La Thiel Fellowship est un programme créé par le co-fondateur de PayPal, Peter Thiel, pour aider les jeunes talentueux à poursuivre d’autres passions au lieu d’un diplôme universitaire traditionnel de quatre ans. Dans une vidéo présentant les lauréats de la bourse, Oler a déclaré qu’il aimait « faire des visualisations mathématiques avec des imprimantes 3D ».
Revenons rapidement à sa vie professionnelle et il est clair que son amour des mathématiques et de la technologie ne l’a jamais quitté. À partir de 2015, il a travaillé chez Google Brain pendant trois ans et a rejoint Google DeepMind en 2023. Il a commencé comme stagiaire puis a été promu chercheur. En cours de route, il a contribué à la création d’outils permettant de visualiser ce qui se passe à l’intérieur des réseaux de neurones dans un domaine de recherche émergent appelé « interprétabilité mécanique ». À l’époque, ce domaine n’était pas très populaire car les chercheurs se concentraient principalement sur la recherche de rendre l’IA plus puissante.
Pourtant, pendant son séjour chez Google, Oler a contribué à des recherches qui ont attiré une nouvelle attention sur l’étude du fonctionnement des réseaux neuronaux. Il s’agit notamment d’un article intitulé « Building Blocks of Interpretability », qui a fourni l’une des premières fenêtres sur la façon dont les réseaux neuronaux dérivent des concepts complexes à partir d’éléments de base plus simples.
« Au départ, ces questions intéressaient un assez petit nombre de personnes, mais j’ai finalement attiré l’attention du créateur de ChatGPT, OpenAI, où j’ai transformé mon intérêt pour la logique des réseaux neuronaux en un travail à temps plein », a déclaré Oler sur le podcast « 80 000 heures ».
De 2018 à 2020, Olah a dirigé l’équipe d’interprétabilité d’OpenAI. Chez OpenAI, nous avons travaillé sur deux projets de recherche révolutionnaires. Le premier, connu sous le nom de projet Circuits, visait à prouver que les réseaux de neurones contiennent des informations perceptibles et lisibles par l’homme, formées par des modèles structurés de neurones pouvant être interprétés.
La seconde a été la découverte de neurones multimodaux dans CLIP, un modèle OpenAI permettant de connecter du texte et des images. Son équipe a découvert que certains neurones du modèle « se déclenchaient » en réponse aux mêmes concepts, tels que « Spider-Man », notamment des photos, des dessins et du texte. Cette étude a montré comment les réseaux neuronaux artificiels se comportent de manière similaire au cerveau humain.
En 2020, Oler était l’un des sept premiers employés d’OpenAI, dont le PDG Dario Amodei, à quitter l’entreprise en raison de préoccupations concernant la sécurité de l’IA. Ola a ensuite aidé à cofonder Anthropic avec le groupe, évalué à 965 milliards de dollars à la suite d’un récent cycle de financement. La société a secrètement déposé une introduction en bourse cette semaine. La valeur nette d’Ola s’élève actuellement à un peu moins de 8 milliards de dollars, selon l’indice Bloomberg Billionaires.
Les commentaires d’Oler auprès du pape vont à l’encontre des points de vue d’autres acteurs de l’industrie, dont Marc Andreessen, qui a soutenu dans son Manifeste techno-optimiste de 2023 que « la confiance et la sécurité » et « l’éthique technologique » font partie d’une campagne démoralisante menée par des « ennemis » de la technologie et de la vie.
Néanmoins, les commentaires d’Oler sont globalement cohérents avec la mission d’Anthropic de se concentrer sur la sécurité et de ne pas hésiter à publier des recherches sur les risques de l’IA. Cela s’aligne également sur l’encyclique du Pape Magnifica Humanitas, qui sert en quelque sorte de cadre moral à l’IA, appelant à une « approche prudente et prudente » de son développement et à la considération des humains plutôt que des machines.
Chez Anthropic, Oler a contribué à faire progresser la recherche sur « l’interprétabilité mécanique », qui vise à procéder à l’ingénierie inverse des modèles d’IA en identifiant quels groupes de neurones artificiels sont activés dans quel but et comment ils façonnent le résultat du modèle.
En 2024, le magazine Time l’a nommé sur la liste TIME100 AI des personnes les plus influentes de l’industrie de l’IA.
« Si nous pouvons vraiment comprendre ces systèmes, ce qui nécessite beaucoup de progrès, nous pourrons peut-être déterminer si ces modèles sont réellement sûrs », a-t-il déclaré au magazine Time. « Ou est-ce que ça a juste l’air sûr ? »

