Az Alibaba Qwen csapata négy új nyílt forráskódú nyelvi modellt adott ki, amelyek helyi gépen is futtathatók. A Qwen3.5-35B-A3B, Qwen3.5-122B-A10B és Qwen3.5-27B modellek Apache 2.0 licenc alatt letölthetők, míg a Qwen3.5-Flash változat API-n keresztül érhető el.

A 35B-A3B modell mindössze 3 milliárd aktív paramétert használ tokenenként a 256 szakértőből álló MoE architektúrából, mégis felülmúlja a GPT-5-mini-t és a Claude Sonnet 4.5-öt számos benchmarkon. A 4-bites kvantálással akár 1 millió tokenes kontextus is kezelhető fogyasztói GPU-kon, 32 GB VRAM-mal.

A Qwen3.5-Flash API árazása kiemelkedően alacsony: 0,10 dollár input és 0,40 dollár output tokenenként milliónként. A modell alapértelmezetten támogatja a Thinking Mode-ot, azaz belső gondolkodási láncot generál a válasz előtt.