Az Oculus társalapítója, Brendan Iribe által indított Sesame startup a „voice presence” elérésére fókuszál, vagyis arra, hogy a digitális asszisztensekkel való interakciók autentikusabbnak és érzelmileg rezonánsabbnak tűnjenek. A Conversational Speech Model (CSM) a szöveg és hang kontextusát integrálja, hogy a beszéd alkalmazkodjon a beszélgetés történetéhez, hangneméhez és ritmusához, mindezt rendkívül alacsony késleltetéssel.

A most kiadott demójuk impozáns, de a kutatók elismerik, hogy még van hova fejlődni az emberihez hasonló prozódia és a beszélgetési folyamat tökéletesítésében. A Sesame tervei között szerepel a modell képességeinek bővítése, a támogatott nyelvek számának növelése, valamint a kulcsfontosságú kutatási elemek nyílt forráskódúvá tétele.