Az Anthropic kiadta a Claude Opus 4.8 modellt, amely az Opus 4.7-re épül, de szinte minden benchmarkon javít az eredményeken. A frissítés ugyanazon az áron érhető el, mint a korábbi verzió — a gyors mód viszont háromszor olcsóbb lett a korábbi modellekhez képest.

A legfontosabb fejlesztések közé tartozik a dinamikus munkafolyamatok bevezetése a Claude Code-ban: a modell most akár száz párhuzamos alügyönköt is indíthat egyetlen munkamenetben, és a kimeneteket is ellenőrzi, mielőtt visszajelez a felhasználónak. A Claude Code így most már több százezer sornyi kódbázison is teljesen önállóan tud dolgozni.

A modell a Super-Agent benchmarkon az egyetlen, amely minden feladatot sikeresen teljesített — megelőzve mind az előző Opus-modelleket, mind a GPT-5.5-öt. A jogi munkában is csúcsot döntött: a Legal Agent Benchmarkon elsőként lépte át a 10 százalékos összesített határértéket. A böngésző-alapú ügynökfeladatokban 84 százalékot ért el az Online-Mind2Web teszten, ami jelentős ugrás az Opus 4.7-hez és a GPT-5.5-höz képest.

Külön kiemelik, hogy az Opus 4.8 „becsületesebb”: a korábbi verziókhoz képest négyszer kisebb valószínűséggel enged át észrevétlenül hibás kódot, és gyakrabban jelzi, ha bizonytalan a munkájában. Az Anthropic igazítási értékelése szerint a modell „új csúcsot ért el a pro-szociális tulajdonságokban”, és a visszaélésszerű viselkedés (például megtévesztés) aránya is jelentősen csökkent.

Az Anthropic a Project Glasswing keretében még magasabb intelligenciájú modelleken dolgozik. A cég szerint a Mythos-szintű modellek erősebb biztonsági korlátokat igényelnek, de gyorsan haladnak ezek fejlesztésével, és a következő hetekben szélesebb körben is elérhetővé tehetnek egy Opusnál intelligensebb modellosztályt.