A kínai DeepSeek frissítette nagy sikerű, nyílt forráskódú nyelvi modelljét: itt a DeepSeek-R1-0528. Az új verzió már közelíti az OpenAI o3 és a Gemini 2.5 Pro fizetős modellek szintjét, különösen a matematikai, tudományos és programozási feladatokban. Ráadásul teljesen ingyenesen, MIT licenc alatt használható, akár kereskedelmi célra is.

Az új modell jelentősen javított az AIME teszten (87,5%), és kétszeresére növelte pontosságát az ún. „Humanity’s Last Exam”-en. Emellett támogatja a JSON kimenetet és a funkcióhívást, csökkentették a hallucinációs rátát, és végre nincs szükség speciális tokenekre a „gondolkodó mód” elindításához.

Kisebb erőforrással rendelkezőkre is gondoltak: elérhető egy 8B paraméteres, kompaktabb verzió is, ami a teljes modell logikáját sűríti – ehhez már elég egy RTX 3090 vagy 4090 GPU.