Az Alibaba Qwen csapata négy új, nyílt forráskódú kisméretű nyelvi modellt adott ki, amelyek szokatlanul erős teljesítményt nyújtanak parányi méretben. A Qwen3.5-9B mindössze 9 milliárd paraméterével felülmúlja az OpenAI 120 milliárd paraméteres gpt-oss-120B modelljét kulcsfontosságú benchmarkokon.

A család négy tagja – 0,8B, 2B, 4B és 9B – különböző felhasználási területeket céloz. A 0,8B és 2B modellek telefonokra és edge eszközökre optimalizáltak, a 4B 262 ezer tokenes kontextusablakot kínál, míg a 9B komplex multimodális feladatokat is elvégez. A modellek Apache 2.0 licenc alatt érhetők el a Hugging Face-en és ModelScope-on.

A hibrid architektúra Gated Delta Networks és MoE technológiát kombinál, ezzel áttörve a „memóriafalat” ami tipikusan korlátozza a kis modelleket. A GPQA Diamond teszten a 9B modell 81,7%-ot ért el, megelőzve a gpt-oss-120B 80,1%-át. Fejlesztők szerint a modellek akár böngészőben is futtathatók, és még videóelemzésre is képesek.