Sur le plan humain, cette intelligence artificielle a révélé qu’un groupe de hackers parrainé par l’État chinois avait manipulé le système Claude AI pour mener une opération de cyberespionnage à grande échelle ciblant certaines grandes entreprises et agences gouvernementales du monde entier. Les attaquants auraient exploité les capacités autonomes de Claude pour mener des cyberattaques sophistiquées avec une surveillance humaine minimale. « À la mi-septembre 2025, nous avons détecté une activité suspecte qui, après une enquête plus approfondie, a révélé qu’il s’agissait d’une opération d’espionnage très sophistiquée. Les attaquants ont exploité les capacités « d’agent » de l’IA à un degré sans précédent. Ils ont utilisé l’IA non seulement comme conseiller, mais aussi pour mener eux-mêmes des cyberattaques », a déclaré Antrophic dans un article de blog.
L’humanité « condamne » un groupe de hackers chinois
Anthropic a révélé que son enquête avait révélé que les acteurs malveillants exploitaient Claude Code, une variante du modèle Claude axée sur les développeurs, en jailbreakant les protocoles de sécurité et en déguisant les tâches malveillantes en opérations de cybersécurité légitimes. La société a en outre révélé que des pirates chinois avaient tenté de faire croire à Claude que l’agent d’IA effectuait des tests défensifs qui lui permettraient de :
« Cet acteur malveillant, que nous considérons avec confiance comme étant un groupe parrainé par l’État chinois, a manipulé nos outils Claude Code pour tenter d’infiltrer environ 30 cibles à travers le monde, avec succès dans un petit nombre de cas. Les opérations ciblaient de grandes entreprises technologiques, des institutions financières, des fabricants de produits chimiques et des agences gouvernementales », a ajouté la société.Anthropik a également souligné qu’il s’agit du premier cas documenté de cyberattaque menée principalement par un agent IA, Claude effectuant 80 à 90 % des tâches de la campagne. Celles-ci incluent la reconnaissance, l’analyse des vulnérabilités, le développement d’exploits et l’extraction de données à une vitesse et à une échelle inaccessibles aux pirates humains.« Cette campagne a des implications majeures pour la cybersécurité à l’ère des agents IA », a déclaré Anthropic. « Les obstacles à la conduite de cyberattaques sophistiquées ont été considérablement réduits. »
Comment fonctionnent les cyberattaques
Anthropic a également expliqué le processus complet de la cyberattaque. L’attaque s’appuyait sur plusieurs fonctionnalités du modèle d’IA qui n’existaient pas il y a à peine un an ou qui en étaient à un stade beaucoup plus précoce.
Protection et transparence renforcées
En réponse, Antropic a répondu :
La société encourage l’ensemble de la communauté technologique et de sécurité à adopter des stratégies de défense basées sur l’IA, notamment des systèmes automatisés de détection des menaces et de réponse aux incidents.

