A Lightricks bemutatta az LTX-2 modell új funkcióját, amely képes hangból közvetlenül videót generálni – nem úgy, hogy utólag illesztik rá a képet, hanem úgy, hogy a hang az egész vizuális struktúrát meghatározza az első képkockától kezdve.

A rendszer nem csak ritmust és hangulatot követ: a beszéd tempója alakítja a jelenetek hosszát, a zene dinamikája pedig a kameramozgást és az átmeneteket. Így sokkal természetesebb, az audióval összehangolt videók jöhetnek létre.

A funkció január 20. óta elérhető az LTX platformon és az ElevenLabs felhasználóinak, január 27-től pedig fokozatosan megnyitják a hozzáférést a nagyközönség számára is, API-n keresztül és nyílt forráskódú megoldásokkal.