A 2024-es év jelentős előrelépéseket hozott a nagy nyelvi modellek területén. A korábban egyeduralkodó GPT-4 szintjét számos új modell érte el vagy haladta meg – már 18 szervezet rendelkezik ilyen képességű AI rendszerrel. Az új modellek hatékonyabbak is lettek: ma már akár egy erősebb laptoppal is lehet GPT-4 szintű modelleket futtatni, az árak pedig a töredékükre csökkentek.
A modellek képességei is bővültek: szinte minden jelentős szereplő multimodális modelleket adott ki, amelyek képesek képek, hangok és videók feldolgozására is. Különösen izgalmas fejlemény a valós idejű hang- és kamerakapcsolat megjelenése a ChatGPT-ben és a Google Geminiben. Az is kiderült, hogy a szintetikus tréningadatok remekül működnek – a nagyobb modellek által generált adatokkal kisebb, hatékonyabb modelleket lehet tanítani.
Ugyanakkor az LLM-ek használata bizonyos szempontból még komplexebbé vált. A különböző modellek és szolgáltatások közötti eligazodás, illetve a modellek korlátainak és lehetőségeinek megértése komoly kihívást jelent az átlagfelhasználók számára. Az év egyik kulcsszava a „slop” kifejezés, amely a kéretlen és ellenőrizetlen AI-generált tartalmakra utal. Problémát jelent az is, hogy a lakosság nagy része nincs tisztában a technológia valódi képességeivel és korlátaival.