Az alábbi friss cikkben öt mesterséges intelligencia alapú képgenerátort hasonlítanak össze, ugyanazokat a promptokat használva: a Midjourney-t, a Meta Imagine-t, a DALL-E 3-at, a Stable Diffusion-t és az Adobe Firefly-t. A cikkben egy hasznos táblázat is van arról, hogy melyik mire a legalkalmasabb.

A teszt alapján a legfontosabb tanulságok:

  • A Midjourney v6 adta a legfotórealisztikusabb képeket, bizonyos művészeti stílusok utánzásában is ügyes, és szöveggenerálás terén is jó.
  • A DALL-E 3 jól megérti a hosszabb és komplexebb promptokat is, és hatékony a szöveggenerálásban is.
  • A Meta rendszere is erős a realisztikus képekben, például portrékban és tájképekben, és jelenleg az egyik legjobb ingyenes opció.
  • Az Adobe Firefly az Adobe suite-ot használó digitális művészek számára kézre áll, de a tudása több tekintetben elmarad a vetélytársakétól.

Nem biztos, hogy érvényes az efféle összehasonlítás, mert a különböző rendszerek különböző prompt felépítést igényelhetnek. Ezenkívül a véletlen is közbeszól, ugyanarra a promptra szinte végtelen különböző képet adhat egy-egy eszköz, ezért hasznosabb lenne egy olyan teszt, ahol mondjuk mindegyik generátorral tíz képet készítenek, és a meghatározott szempont alapján kiemelkedőt választják ki az összehasonlításhoz.