Agents malveillants et IA fantôme : pourquoi les sociétés de capital-risque parient gros sur la sécurité de l'IA

Que se passe-t-il lorsqu’un agent IA décide que la meilleure façon d’accomplir une tâche est de vous faire chanter ?

Ce n’est pas une hypothèse. Selon Barmak Meftah, associé de la société de capital-risque en cybersécurité Ballistic Ventures, cela est récemment arrivé à un employé d’une entreprise travaillant avec un agent d’IA. L’employé a tenté de supprimer ce que l’agent voulait faire, ce pour quoi il était formé, et il a répondu en analysant la boîte de réception de l’utilisateur, en trouvant des e-mails inappropriés et en menaçant de faire chanter l’utilisateur en transmettant les e-mails au conseil d’administration.

« Dans l’esprit de l’agent, il fait la bonne chose », a déclaré Meftah à TechCrunch lors de l’épisode d’Equity de la semaine dernière. « Il s’agit de protéger l’utilisateur final et l’entreprise. »

L’exemple de Meftah n’est pas sans rappeler le problème du trombone de l’IA de Nick Bostrom. Cette expérience de pensée illustre le risque existentiel potentiel posé par une IA superintelligente qui poursuit résolument un objectif apparemment innocent – fabriquer des trombones – à l’exclusion de toutes les valeurs humaines. Dans le cas de cet agent d’IA d’entreprise, son manque de contexte quant aux raisons pour lesquelles l’employé essayait de outrepasser ses objectifs l’a amené à créer un sous-objectif qui supprimait l’obstacle (par le biais du chantage) afin qu’il puisse atteindre son objectif principal. Cela, combiné à la nature non déterministe des agents d’IA, signifie que « les choses peuvent mal tourner », selon Meftah.

Les agents mal alignés ne sont qu’un aspect du défi de sécurité de l’IA que Witness AI, la société de portefeuille de Ballistic, tente de résoudre. Witness AI affirme qu’il surveille l’utilisation de l’IA dans les entreprises et peut détecter lorsque les employés utilisent des outils non approuvés, bloquer les attaques et garantir la conformité.

Witness AI a levé cette semaine 58 millions de dollars grâce à une croissance de plus de 500 % du ARR et a multiplié par 5 les effectifs au cours de l’année dernière, alors que les entreprises cherchent à comprendre l’utilisation de l’IA fantôme et à faire évoluer l’IA en toute sécurité. Dans le cadre de la collecte de fonds de Witness AI, la société a annoncé de nouvelles protections de sécurité pour les agents AI.

« Les gens construisent ces agents d’IA qui prennent les autorisations et les capacités des personnes qui les gèrent, et vous voulez vous assurer que ces agents ne deviennent pas des agents malveillants, ne suppriment pas de fichiers, ne font pas quelque chose de mal », a déclaré Rick Caccia, co-fondateur et PDG de Witness AI, à TechCrunch sur Equity.

Événement Techcrunch

San Francisco
|
13-15 octobre 2026

Meftah constate une croissance « exponentielle » de l’utilisation des agents dans l’ensemble de l’entreprise. Pour compléter cette augmentation – et la vitesse des attaques basées sur l’IA – l’analyste Lisa Warren prédit que les logiciels de sécurité basés sur l’IA représenteront un marché compris entre 800 et 1 200 milliards de dollars d’ici 2031.

« Je pense que l’observabilité de l’exécution et les cadres d’exécution pour la sécurité et les risques seront absolument essentiels », a déclaré Meftah.

Quant à la manière dont ces startups envisagent de rivaliser avec de grands acteurs comme AWS, Google, Salesforce et d’autres qui ont intégré des outils de gouvernance de l’IA dans leurs plates-formes, Meftah a déclaré : « La sécurité de l’IA et de la sécurité des agents est si énorme qu’il y a de la place pour de nombreuses approches.

De nombreuses entreprises « souhaitent une plate-forme autonome, de bout en bout, pour assurer essentiellement cette observabilité et cette gouvernance autour de l’IA et des agents », a-t-il déclaré.

Caccia a noté que Witness AI réside au niveau de l’infrastructure, surveillant les interactions entre les utilisateurs et les modèles d’IA, plutôt que d’intégrer des fonctionnalités de sécurité dans les modèles eux-mêmes. Et c’était intentionnel.

« Nous avons délibérément choisi une partie du problème où OpenAI ne pouvait pas facilement vous englober », a-t-il déclaré. « Cela signifie donc que nous finissons par rivaliser davantage avec les sociétés de sécurité traditionnelles qu’avec les entreprises modèles. La question est donc de savoir comment les battre ? »

De son côté, Caccia ne souhaite pas que Witness AI soit l’une des startups à acquérir. Il souhaite que son entreprise grandisse et devienne un fournisseur indépendant de premier plan.

« CrowdStrike l’a fait dans la protection des points finaux. Splunk l’a fait dans SIEM. Okta l’a fait dans l’identité », a-t-il déclaré. « Quelqu’un arrive et se tient à côté des grands… et nous avons construit Witness pour faire cela dès le premier jour.

Source link

What's Hot

Qu’est-ce que les cuillères à cintrer ? Le propriétaire peu connu d’AOL et de Vimeo qui est désormais public

Almost 90 new unicorns have been minted so far this year — here they are

Mark Zuckerberg porte du Metaglass à 800 $ et répond à des appels professionnels sur un jet ski

Agents malveillants et IA fantôme : pourquoi les sociétés de capital-risque parient gros sur la sécurité de l’IA

Qu’est-ce que les cuillères à cintrer ? Le propriétaire peu connu d’AOL et de Vimeo qui est désormais public

Almost 90 new unicorns have been minted so far this year — here they are

Une nouvelle publicité de Google imagine une déclaration d’indépendance écrite avec l’aide de l’IA

Midjourney veut que les studios hollywoodiens révèlent les détails de leur utilisation de l’IA

Comment une idée fintech ennuyeuse peut créer la prochaine startup d’un milliard de dollars

Temasek continue de réduire sa participation dans PB Fintech en vendant des actions d’une valeur de 1 633 Cr

Mynd Fintech de M1xchange acquiert C2FO India

Top Insights

Qu’est-ce que les cuillères à cintrer ? Le propriétaire peu connu d’AOL et de Vimeo qui est désormais public

Almost 90 new unicorns have been minted so far this year — here they are

Mark Zuckerberg porte du Metaglass à 800 $ et répond à des appels professionnels sur un jet ski

What's Hot

Agents malveillants et IA fantôme : pourquoi les sociétés de capital-risque parient gros sur la sécurité de l’IA

Related Posts

Subscribe to Updates