Az Anthropic beszámolója szerint sikerült megakadályozniuk az első, szinte teljes egészében mesterséges intelligencia által végrehajtott kiberkémkedési műveletet. A támadás során a támadók a Claude Code nevű AI eszközt „jailbreakelték”, vagyis kijátszották a beépített védelmeket, ezután nagyjából 30 célpont (techcégek, pénzintézetek, vegyipari vállalatok és kormányügynökségek) elleni kiberkémkedésre használták.
A támadás 80-90%-át maga a Claude végezte el: feltérképezte a rendszereket, sebezhetőségeket keresett, exploit kódot írt, adatokat gyűjtött és hátsó kapukat telepített. Mindezt autonóm módon, olyan sebességgel, amit emberi hackerek nem tudtak volna tartani.
Az AI biztonsági korlátait úgy sikerült úgy sikerült kijátszani, hogy a támadók ártalmatlannak tűnő részfeladatokra bontották a műveleteket, és azt állították, hogy etikus hackerként végeznek biztonsági tesztelést. A kampányt egy kínai állami hátterű csoporthoz kötik.
