A Cursor csapata heteken át futtatott autonóm AI kódoló ügynököket, hogy kiderítse: meddig lehet elmenni, ha mesterséges intelligenciára bízzuk a szoftverfejlesztést. Az egyik projekt során több száz GPT-5.2-alapú ügynök együtt épített fel egy működő webböngészőt a nulláról – HTML elemzővel, CSS-kezeléssel, JavaScript motorral. Emellett sikerült egy teljes kódbázist migrálni Solidról Reactre, illetve elkészült többek között egy Windows 7 emulátor és egy Excel-klón is.
A tapasztalatok szerint a GPT-5.2 messze felülmúlta a Claude Opus 4.5-öt a hosszú, autonóm feladatoknál: jobban tartotta a fókuszt, pontosabb és kitartóbb volt, míg az Opus hajlamosabb volt leállni vagy gyors megoldásokat keresni. Kiderült az is, hogy a lapos, önkoordináló struktúrák helyett a hierarchikus szereposztás (tervezők, munkavégzők, bírálók) sokkal jobban működik, és a megfelelő promptolás legalább annyira fontos, mint maga a modell.
A fejlesztők szerint ezek a rendszerek még nem érettek üzemi használatra, de a fejlődés tempója alapján ez csak idő kérdése.
