Alig egy héttel azelőtt, hogy OpenAI szakemberei a Voice Engine modelljük veszélyeiről írtak cikket, kutatók egy csoportja bejelentette a nyílt forráskódú „VoiceCraft” projektet, ami minden létező beszéd-szintetizáló modellt túlszárnyal. Kutatási célra ingyen letölthető és használható, és néhány másodpercnyi referencia anyag alapján képes egy ember hangját élethűen klónozni (angol nyelven).

A tesztek során jelentősen felülmúlta a hasonló rendszerek, mint a FluentSpeech vagy a VALL-E teljesítményét, olyannyira, hogy még az emberek számára is nehéz volt megkülönböztetni a generált hangokat a valós felvételektől. Ez a fejlesztés más megvilágításba helyezi az OpenAI által felvetett aggodalmakat, és új kérdéseket vet fel a hangalapú AI technológiák etikájáról és a jövőbeli alkalmazásokról.

Érdemes belehallgatni a példa anyagokba a linkelt oldalon, nagyon meggyőző.