Az alábbi friss cikkben öt mesterséges intelligencia alapú képgenerátort hasonlítanak össze, ugyanazokat a promptokat használva: a Midjourney-t, a Meta Imagine-t, a DALL-E 3-at, a Stable Diffusion-t és az Adobe Firefly-t. A cikkben egy hasznos táblázat is van arról, hogy melyik mire a legalkalmasabb.
A teszt alapján a legfontosabb tanulságok:
- A Midjourney v6 adta a legfotórealisztikusabb képeket, bizonyos művészeti stílusok utánzásában is ügyes, és szöveggenerálás terén is jó.
- A DALL-E 3 jól megérti a hosszabb és komplexebb promptokat is, és hatékony a szöveggenerálásban is.
- A Meta rendszere is erős a realisztikus képekben, például portrékban és tájképekben, és jelenleg az egyik legjobb ingyenes opció.
- Az Adobe Firefly az Adobe suite-ot használó digitális művészek számára kézre áll, de a tudása több tekintetben elmarad a vetélytársakétól.
Nem biztos, hogy érvényes az efféle összehasonlítás, mert a különböző rendszerek különböző prompt felépítést igényelhetnek. Ezenkívül a véletlen is közbeszól, ugyanarra a promptra szinte végtelen különböző képet adhat egy-egy eszköz, ezért hasznosabb lenne egy olyan teszt, ahol mondjuk mindegyik generátorral tíz képet készítenek, és a meghatározott szempont alapján kiemelkedőt választják ki az összehasonlításhoz.