Az Alibaba AI-részlege, a Qwen bemutatta a QwQ-32B nyílt forráskódú, „érvelő” típusú nyelvi modellt, amely a méretéhez képest meglepően jól teljesít a benchmark teszteken: a Deepseek R1-hez hasonló eredményeket ér el, miközben 20-szor kisebb, és akár egy otthoni gépen is futtatható.
A QwQ-32B többek között matematikai és programozási feladatokra van kihegyezve, és több lépcsős megerősítéses tanulással (RL) képezték. Az Apache 2.0 licencnek köszönhetően szabadon letölthető, testreszabható, és felhasználható, akár kereskedelmi célokra is.
A felhasználói visszajelzések alapján ez a modell nemcsak a benchmarkokon teljesít jól, hanem több területen valóban felér a legerősebb zárt modellekkel.