Amiről kevesebb szó esik a GPT-4o megjelenése kapcsán, az a modell képgeneráló képessége, ami egyelőre nem elérhető a nagyközönség számára – a ChatGPT még mindig a különálló Dall-E modellt veszi igénybe a képek készítéséhez, pedig annál sokkal fejlettebb képességei vannak az új modellnek. Az OpenAI cikkében példákkal mutatják be a modellnek ezt az oldalát, és ezek alapján az OpenAI megint maga mögé utasíthatja a konkurenciát, mert a GPT-4o bizonyos tekintetben jóval előttük jár.

Az új modelltől már tényleg úgy kérhetünk képeket, mint egy grafikustól, például konzisztens objektumokat generál több különböző képen, és módosítani is tud egy adott képet szinte bármilyen módon. A konzisztens objektumoknak köszönhetően akár 3D-s tárgyakat is létre tud hozni. Hosszú szövegeket is jól tud megjeleníteni a képeken. Az OpenAI állítólag még maga is csak most ismerkedik a valódi multimodalitásban rejlő lehetőségekkel.