A Google elérhetővé tette a Gemini 3.1 Flash Live modellt a Gemini Live API-n keresztül. Az új modell valós idejű hang- és vision-alapú AI ügynökök építésére szolgál, amelyek képesek feldolgozni a környezetüket és szinte azonnal válaszolni.
A Flash Live jelentősen csökkenti a késleltetést és természetes hangú párbeszédeket tesz lehetővé. A modell zajos, valós környezetben is hatékonyan működik: kiszűri a háttérzajokat – például a forgalom vagy a televízió hangját – és pontosabban követi az összetett rendszerutasításokat. Több mint 90 nyelvet támogat a valós idejű multimodális beszélgetésekhez.
A Google AI Studio-n és a Gemini API-n keresztül már most elérhető a modell fejlesztők számára. Már most olyan alkalmazások építenek rá, mint a Stitch designtervező-eszköz, az Ato időskori AI társ, vagy a Weekend nevű szerepjáték-mester AI – mindegyik természetes hangú, alacsony késleltetésű párbeszédeket használva.
