A párizsi székhelyű non-profit AI labor, a Kyutai egy új AI modellt mutatott be, ami képes valós idejű, természetes párbeszédekre. A Moshi nevű rendszerük a ChatGPT új beszéd funkciójához hasonlóan egyszerre tud beszélni és a felhasználó szavait értelmezni, félbe lehet szakítani miközben beszél, és több tucat különböző érzelmet és beszédstílust tud kifejezni, beleértve a suttogást, az éneklést, vagy akár a francia akcentust.

Az OpenAI rendszerével ellentétben a Moshi már most használható, és a fejlesztők hamarosan szabadon hozzáférhetővé teszik a Moshi minden komponensét. Tervben van egy kisebb változat is, amely akár MacBookon vagy egy átlagos GPU-n is futtatható lesz, és további fejlesztéseket ígérnek a felhasználói visszajelzések alapján.