A nem-érvelő típusú AI modellek mezőnyét a tegnap megjelent DeepSeek V3-0324 vezeti – most először fordul elő, hogy egy nyílt modell megelőz minden zárt rendszerű riválist. A modell 7 pontot ugrott előre az Artificial Analysis Intelligence Index rangsorban, megelőzve többek közt a Gemini 2.0 Pro-t, a Claude Sonnet 3.7-et és a Llama 3.3-at is.

A DeepSeek V3-0324 egy hatalmas, 671 milliárd paraméteres modell, de a MoE-architektúrának köszönhetően ebből csupán 37 milliárdot aktivál egyszerre – így éri el nagyobb modellek teljesítményét, jóval alacsonyabb erőforrásigénnyel. A 4 bites verzió akár egy Mac Studio M3 gépen is futtatható, több mint 20 token/másodperces sebességgel.