A francia AI startup, a Mistral bemutatta a legújabb fejlesztését, amely egy korszerű, nyílt forrású beszédfelismerő és -értelmező modell. Két méretben érhető el (24B és 3B), és teljesen ingyenesen használható, Apache 2.0 licenc alatt.
A Voxtral nemcsak átírja a beszédet, hanem képes hosszabb hanganyagokat is értelmezni, kérdésekre válaszolni, összefoglalót készíteni, és közvetlenül funkciókat hívni a kimondott utasítások alapján.
Az eddigi modelleknél pontosabb (nemcsak a Whisper-t, de a fizetős ElevenLabs Scribe-ot is megelőzi több teszten), ráadásul olcsóbban működtethető, és natívan többnyelvű. A vállalati felhasználók számára elérhető privát telepítés, testreszabott finomhangolás és skálázható integráció.
