Az Adobe 2016-ban mutatta be a VoCo nevű projektjét, ami egy „hangalapú Photoshop” lett volna: hangfelvételeket lehetett könnyedén módosítani vele, akár teljesen új szavakat adva a beszélő szájába. Bár eleinte az Adobe védte az ötletet, aminek kétségtelenül vannak érdemi felhasználásai is, a visszaélések veszélye miatt végül nem lett belőle termék.

Az OpenAI új eszköze, a Sora valósághű videót tud készíteni (vagy módosítani) szöveges utasítások alapján, és bár a fejlesztők hangsúlyozzák, hogy csak a biztonsági kérdések rendezése után kerülhet a nagy nyilvánosság elé, az nem valószínű, hogy a visszaéléseket meg tudnák akadályozni. A VoCo-éhoz hasonló etikai dilemmák ma már nem sokat nyomnak a latban – az szinte elképzelhetetlen például, hogy az OpenAI visszakozna, és ne válna hamarosan kézzelfogható termékké ez a technológia.

A VoCo-nak 2016-ban 20 percnyi, jó minőségű hanganyagra volt szüksége egy ember hangjának a klónozásához, a Meta fél éve bemutatott Voicebox rendszerének elég kb. 7 másodperc.