A kínai MiniMax bejelentette az M2.7 modellt, amelynek állítólag aktív szerepe volt a saját fejlesztésében. A modell autonóm optimalizálási ciklusokon keresztül javította saját tanítási folyamatát, és versenyképes benchmark eredményeket ért el.
A fejlesztés során az M2.7 frissítette saját tudásbázisát, komplex képességeket épített ki az agent infrastruktúrájában, és továbbfejlesztette a tanítási folyamatát. A MiniMax szerint ez az első modelljük, amely „részt vesz a saját evolúciójában” – és olyan jövőt vázolnak, ahol az AI önfejlesztése „fokozatosan teljes autonómia felé halad”.
Az OpenAI a múlt héten hasonló állításokat tett a GPT-5.3 Codex kódoló modellről, amely a korai verzióit használta hibakeresésre és teszteredmények értékelésére. A MiniMaxnál egy belső kutatóagent rendszert állítottak fel, amely az RL csapat napi munkafolyamatában segít – az emberi kutatók csak kritikus döntésekhez lépnek be.
