A Subquadratic bejelentette a SubQ 1M-Preview modellt, és ha a benchmarkok valódiak, ez lehet a 2026-os év egyik legjelentősebb AI bejelentése. A transformer architektúra 2017 óta uralja a mesterséges intelligenciát — minden nagy nyelvi modell erre épül, és mindegyik ugyanazzal a skálázási problémával küzd: ha megkétszerezzük a kontextus hosszát, a számítási igény nem kétszeresére, hanem négyszeresére nő. Ezért álltak meg a frontier modellek nagyjából 1 millió tokennél, és ezért olyan drága a hosszú kontextusú működés.

A SubQ ezt megoldja. Lineáris skálázódást kínál: 12 millió tokennél majdnem 1000-szer kevesebb számítás kell, mint a hagyományos modelleknek, és 1 millió token esetén 52-szer gyorsabb működést tesz lehetővé, mint a FlashAttention algoritmus. Mindeközben csúcskategóriás pontosságot ér el: 95% a RULER 128K teszten (Claude Opus 4.6: 94.8%), és 81.8 a SWE-Bench kódolási feladatokon (Opus 4.6: 80.8). Az árazás: kevesebb mint 1.50 dollár millió tokenenként, ami a Claude Opus árának alig huszada. A RULER teszt futtatása SubQ-val 8 dollárba került, Opus-szal 2600-ba — 300-szoros költségcsökkentés azonos vagy jobb pontosság mellett.

A Subquadratic 29 millió dolláros seed befektetést kapott, a csapatban pedig korábbi Meta-, Google-, Oxford- és Cambridge-kutatók dolgoznak. A SubQ zárt bétában elérhető API-n keresztül, és érkezett mellé egy SubQ Code nevű kódolóügynök is.

Ha az eredmények független teszteken is visszaigazolódnak, a SubQ lehet az első igazán komoly kihívója a transzformer architektúrának, amely 2017 óta meghatározza az AI fejlődését.