A francia Mistral bemutatta a Mistral 3 modellcsaládot, amely egy nagy teljesítményű „frontier” modellből, és kilenc kisebb, testreszabható változatból áll. Mindegyik multimodális és többnyelvű, nagy kontextusablakkal rendelkeznek (256 ezer token), és a nyílt modellek mezőnyében kiemelkedő a teljesítményük.
A legnagyobb, Large 3 modell 675 milliárd paraméteres (41 milliárd aktív) és a fejlesztők szerint különösen alkalmas komplex dokumentumok elemzésére, kódgenerálásra, és AI-asszisztensként való használatra.
A kisebb modellek háromféle méretben jönnek (3, 8, 14 milliárd paraméter), mindegyik három változatban (base, chat, reasoning), és akár egyetlen GPU-n is futtathatók – helyben, internetkapcsolat nélkül, robotokban, autókban vagy edge eszközökön.
A Mistral filozófiája szerint a vállalatok igényeit ma már nem a legnagyobb modellek szolgálják ki a legjobban, hanem a kisebb, hatékonyan optimalizált rendszerek, amelyek olcsóbban működtethetők, könnyen finomhangolhatók, és egy adott feladatra szabva sokszor felülmúlják hatékonyságban az óriásmodelleket.
