A Llama 3.1-70B-n alapuló új modell ezt a kiemelkedő teljesítményt úgynevezett „reflection tuning” technikával éri el, amivel felismeri és kijavítja saját hibáit, mielőtt véglegesítené a válaszát. Ezzel az egyszerű trükkel a Reflection 70B egy sor benchmark teszten képes legyőzni nem csak a nagyobbik Llama 3.1-405B modellt, de még a GPT-4o, és a Claude 3.5 Sonnet modelleket is.

A modell megalkotója jövő hétre ígéri a 405B változat megjelenését, ami állítása szerint egész egyszerűen a világ legerősebb modellje lesz.

Az ötlet nem új, hasonló technikákat alkalmaznak más AI fejlesztők is: a Claude chatbotról például tudható, hogy egy speciális jelölést használ, amikor „gondolkodik”, és ezeket aztán elrejti a végleges válaszában a felhasználó elől.