Klíčové věci
- OpenAI přidává editační nástroje do DALL-E 3 v ChatGPT pro inline úpravy.
- Nástroje pro úpravy mohou odstranit funkce a provést malé změny, ale potýkají se s podrobnými požadavky.
- Editační nástroje DALL-E 3 jsou užitečné pro některé úkoly, ale mohou vyžadovat několik výzev a trpělivost.
Chtěli jste svůj výtvor DALL-E 3 okamžitě upravit, ale nevěděli jste, jak provést změny?
OpenAI vás slyší a přidala inline editační nástroje do DALL-E 3 v ChatGPT, což vám umožní provádět úpravy vašich výtvorů, aniž byste opustili aplikaci.
Jediným problémem je, že nedělají to, co OpenAI inzeruje, a pokud jde o to, zda získáte požadované úpravy, je to různé. Ale přesto je to začátek toho, co přijde pro úpravy DALL-E 3, a takto fungují.
Co jsou nástroje pro úpravy DALL-E 3?
Chvíli se blížily, ale OpenAI konečně přidala funkci úprav do DALL-E 3 v ChatGPT Plus. Předtím jste se mohli pokusit o úpravy svých výtvorů DALL-E 3, ale obvykle by to vždy vedlo k vytvoření zcela nového obrázku. I kdyby byly výzvy použité k vytvoření upraveného obrázku extrémně podobné první výzvě, kvůli samotné povaze generativní umělé inteligence by se výstup mohl výrazně lišit.
Integrované editační nástroje DALL-E 3 se nyní zaměřují na opravu problémů ve stejném obrázku bez vytváření nové výzvy. Zvýrazníte oblast v obrázku, kterou chcete upravit, vyzvete DALL-E, aby provedl konkrétní změnu (například „odstranit toto“ nebo „přidat tuto funkci“), a jde to.
Příklad oficiálního blogu OpenAI ukazuje, že DALL-E přidává třešňové květy do obrázku kočky ve stylu Ukiyo-e a funguje to perfektně. Podle mých zkušeností mají editační nástroje DALL-E potíže s přidáním tak detailních snímků k existujícímu snímku a většinou nedokážou zpracovat požadavky tohoto druhu.
To neznamená, že nástroje pro úpravy nefungují. Mohou zcela odstranit funkce a provést malé změny, jak je podrobně popsáno níže, ale vše je v malém měřítku.
Jak používat nástroj pro úpravy DALL-E 3
Nejlepší způsob, jak vám ukázat, co umí editační nástroj DALL-E 3, je na několika vhodných příkladech.
Odstranění a vymazání
Editační nástroje DALL-E 3 mohou vymazat některé malé funkce, ale rozhodně to má problémy. Na následujícím obrázku jsem požádal DALL-E, aby vytvořil „robotickou ruku držící zářící, průhledný čtvercový čip s nápisem AI Accelerated“. Pozadí je tmavě modré a vytváří futuristickou a high-tech atmosféru.“
Vzhledem k tomu, že psaní textu je pro generativní umělou inteligenci specifický problém, nepřekvapuje mě, že text byl špatný – požádal jsem DALL-E, aby odstranil pravopisnou chybu. Selhal na první pokus s výzvou „odstraň to, prosím“, ale uspěl na druhý pokus s výzvou „odstraň toto slovo z obrázku“. Takže úspěch ano, ale možná budete muset vyzkoušet různé výzvy, abyste dosáhli výsledku. Poté jsem jej požádal, aby přesunul písmena AI do středu čtverce, což se mu podařilo, přestože z nějakého důvodu spadl můj počítač.
Dále jsem požádal DALL-E, aby mi pomohl upravit obraz televize zobrazující statickou elektřinu. DALL-E je skvělý pro generování jedinečných obrázků, ale některé detaily se pletou nebo poskytuje zdeformovaný text. V tomto případě informační lišta na televizní obrazovce zobrazuje nesmyslný AI text, takže jsem jej chtěl odstranit. První pokus DALL-E zanechal na informační liště stín, zatímco druhý a třetí pokus byly mnohem čistší. Ne dokonalé, ale dost slušné na to, k čemu jsem obrázek používal.
Přidávání a změna
DALL-E 3 může provádět určité změny obrázků, ale opět záleží na měřítku toho, co požadujete. Drobné doplňky a změny jsou možné, ale většinu času editační nástroj DALL-E nedokáže zpracovat to, co je požadováno.
Požádal jsem DALL-E, aby „vytvořil 2:1 4k snímek lidského oka zblízka, buďte detailní“, což vedlo k následujícímu obrázku:
Docela slušné, i když trochu zvláštní (odlesky řas?!), ale chtěl jsem místo toho přepnout barvu duhovky na modrozelenou, což má za následek tento obrázek:
Barva je mírně matná, ale nezměněná a některé prvky jsou mírně zdeformované.
Dále jsem vyzval DALL-E, aby „vytvořil 4k 2:1 hliněný obrázek člověka v tygřím onesie lyžujícího po svahu s pozadím yetiho“.
Opět platí, že původní obrázek je dobrý, má ostré, živé barvy a odpovídá výzvě. Chtěl jsem však yetiho změnit na jiný typ děsivého zvířete.
Místo výměny yetiho za jiné zvíře je prostě úplně pryč. Místo toho jsem se vrátil k původnímu obrázku a požádal ho o přidání dalšího yetiho, což se nepodařilo. Podobně selhal, když byl požádán o přidání dalších stromů do obrázku.
Přidání textu
Tady toho není moc co pokrýt. Jak již bylo řečeno, generativní AI obecně s textem stejně bojuje a přidání textu do obrázku je ještě obtížnější. Vyzval jsem DALL-E, aby vytvořil pohlednici z britského pobřeží, což se povedlo a scénu pěkně zachytil. Pak jsem chtěl k obrázku přidat slova „Sunny Beach“, což prostě nezvládlo. To znamená, že po přibližně šesti nebo sedmi výzvách tam a zpět, které DALL-E připomněly, co má udělat, vytvořil zcela nový obrázek s požadovaným textem. A také přesný text; Nejsem si jistý tím dětským obličejem na slunci, mysli.
Jako další jsem šel pro přání k narozeninám. Tentokrát DALL-E přidal „Happy Birthday“ bez vyzvání, což je vzhledem k tématu v pořádku. Požádal jsem ho tedy o přidání data narozenin na kartu. Opět se nepodařilo přidat datum na kartu, ale po několika kolech výzvy vytvořil nový obrázek s požadovaným datem. V tomto případě by bylo snazší přidat datum sám, zvláště pokud bych chtěl zachovat původní obrázek.
Editační nástroje DALL-E jsou užitečné, ale vyžadují práci (a trochu vytrvalosti)
Zjistil jsem, že editační nástroje DALL-E jsou užitečné pro určité úkoly, ale trvá nějakou dobu, než se správně upraví. Jindy to prostě nebude fungovat a pravděpodobně bude lepší, když vezmete původní výzvu a vyladíte ji, abyste vytvořili nový obrázek.
Editační nástroje DALL-E se pravděpodobně časem zlepší, ale do té doby bude možná lepší upravit obrázek pomocí nástroje pro úpravu obrázků, než absolvovat několik časově náročných kol konverzace s DALL-E. Když to funguje, je to dobré; když to nerozumí nebo neprovede úpravu vůbec, je to frustrující.