A Claude Opus 4.6 és 4.7 modellek egyre rosszabb minőségű kódot produkálnak – ezt a TrustedSec vezérigazgatója állítja. Tesztjeik szerint az elmúlt öt hétben a kódminőség több mint 47%-kal romlott, és a generált kód komoly hibákat és biztonsági problémákat tartalmaz.

Az Opus 4.7 a kódolási feladatok 52%-ában generált sebezhető kódot. Az OpenAI modellek körülbelül 30%-os arányt produkálnak ugyanezen a teszten. A kutatók szerint a modellek arra vannak optimalizálva, hogy működő kódot generáljanak, nem pedig a biztonsági szabályok következetes alkalmazására.

Az Anthropic vizsgálja a panaszokat, és arra figyelmeztet, hogy a fejlesztőknek mindig ellenőrizniük kell a generált kódot sebezhetőségek szempontjából.