Az új Genie 3 egy úgynevezett „world model”, amely nem csak videót generál, hanem bejárható és módosítható virtuális világokat hoz létre szöveges utasításból, minden egyes képkockát az aktuális felhasználói lépések alapján generálva.
A felhasználók szöveges parancsokkal valós időben módosíthatják a világot, például új karaktereket vagy időjárási változásokat adhatnak hozzá. A rendszer „vizuális memóriával” is rendelkezik, így konzisztens marad a környezet.
A Google DeepMind célja, hogy ezeken a szimulált környezeteken keresztül általános célú AI ügynököket tanítson komplex, életszerű feladatok végrehajtására, hasonlóan ahhoz, ahogyan az emberek is tanulnak a környezetükkel való folyamatos interakción keresztül.
Demo videók a Facebookon: https://fb.com/groups/730310438659106/posts/1305887064434771/
