Tavaly egy kutakodó fejlesztő ki tudott csalogatni a Claude-ból egy hosszabb szöveget, ami a chatbot alaptulajdonságait írta le, de nem a system promptból származott. Az Anthropic később megerősítette, hogy ez valóban egy belső dokumentum volt, amit a modell tréningje során használtak – egyfajta beépített értékrend, amely segít a döntéshozatalban és viselkedésformálásban.

Most ezt a dokumentumot hivatalosan is közzétették: a Claude új „alkotmánya” nyílt licenc alatt bárki számára elérhető. A 84 oldalas dokumentum nem csak arról szól, mit „szabad” tennie az AI-nak, hogy biztonságos, etikus, őszinte, és valóban hasznos legyen, hanem azt is elmagyarázza, hogy miért. A kidolgozásban külső szakértők, köztük teológusok is részt vettek.

Az Anthropic célja nem csak a transzparencia növelése, hanem az is, hogy ezzel precedenst teremtsenek: más AI-fejlesztők is vállalják nyíltan, milyen értékeket és prioritásokat építenek a modelljeikbe.