DALL-E 3 nyní obsahuje integrované editační nástroje, ale potřebují práci.

DALL-E 3 nyní obsahuje integrované editační nástroje, ale potřebují práci.

Klíčové věci

  • OpenAI přidává editační nástroje do DALL-E 3 v ChatGPT pro inline úpravy.
  • Nástroje pro úpravy mohou odstranit funkce a provést malé změny, ale potýkají se s podrobnými požadavky.
  • Editační nástroje DALL-E 3 jsou užitečné pro některé úkoly, ale mohou vyžadovat několik výzev a trpělivost.

Chtěli jste svůj výtvor DALL-E 3 okamžitě upravit, ale nevěděli jste, jak provést změny?

OpenAI vás slyší a přidala inline editační nástroje do DALL-E 3 v ChatGPT, což vám umožní provádět úpravy vašich výtvorů, aniž byste opustili aplikaci.

Jediným problémem je, že nedělají to, co OpenAI inzeruje, a pokud jde o to, zda získáte požadované úpravy, je to různé. Ale přesto je to začátek toho, co přijde pro úpravy DALL-E 3, a takto fungují.

Co jsou nástroje pro úpravy DALL-E 3?

Chvíli se blížily, ale OpenAI konečně přidala funkci úprav do DALL-E 3 v ChatGPT Plus. Předtím jste se mohli pokusit o úpravy svých výtvorů DALL-E 3, ale obvykle by to vždy vedlo k vytvoření zcela nového obrázku. I kdyby byly výzvy použité k vytvoření upraveného obrázku extrémně podobné první výzvě, kvůli samotné povaze generativní umělé inteligence by se výstup mohl výrazně lišit.

Integrované editační nástroje DALL-E 3 se nyní zaměřují na opravu problémů ve stejném obrázku bez vytváření nové výzvy. Zvýrazníte oblast v obrázku, kterou chcete upravit, vyzvete DALL-E, aby provedl konkrétní změnu (například „odstranit toto“ nebo „přidat tuto funkci“), a jde to.

Příklad oficiálního blogu OpenAI ukazuje, že DALL-E přidává třešňové květy do obrázku kočky ve stylu Ukiyo-e a funguje to perfektně. Podle mých zkušeností mají editační nástroje DALL-E potíže s přidáním tak detailních snímků k existujícímu snímku a většinou nedokážou zpracovat požadavky tohoto druhu.

To neznamená, že nástroje pro úpravy nefungují. Mohou zcela odstranit funkce a provést malé změny, jak je podrobně popsáno níže, ale vše je v malém měřítku.

Jak používat nástroj pro úpravy DALL-E 3

Nejlepší způsob, jak vám ukázat, co umí editační nástroj DALL-E 3, je na několika vhodných příkladech.

Odstranění a vymazání

Editační nástroje DALL-E 3 mohou vymazat některé malé funkce, ale rozhodně to má problémy. Na následujícím obrázku jsem požádal DALL-E, aby vytvořil „robotickou ruku držící zářící, průhledný čtvercový čip s nápisem AI Accelerated“. Pozadí je tmavě modré a vytváří futuristickou a high-tech atmosféru.“

Ve vztahu :  GTA 5 se nyní prodalo přes 150 milionů kopií

Vzhledem k tomu, že psaní textu je pro generativní umělou inteligenci specifický problém, nepřekvapuje mě, že text byl špatný – požádal jsem DALL-E, aby odstranil pravopisnou chybu. Selhal na první pokus s výzvou „odstraň to, prosím“, ale uspěl na druhý pokus s výzvou „odstraň toto slovo z obrázku“. Takže úspěch ano, ale možná budete muset vyzkoušet různé výzvy, abyste dosáhli výsledku. Poté jsem jej požádal, aby přesunul písmena AI do středu čtverce, což se mu podařilo, přestože z nějakého důvodu spadl můj počítač.

dalle 3 editační nástroje robot drží ai čip
dalle 3 editační nástroje robot drží ai čip upraven pravopisnou chybu
dalle 3 editační nástroje robot drží ai čip odstraněn slovo
dalle 3 editační nástroje robot držící ai čip přesunul slova do středu
dalle 3 editační nástroje robot drží ai čip
dalle 3 editační nástroje robot drží ai čip upraven pravopisnou chybu
dalle 3 editační nástroje robot drží ai čip odstraněn slovo
dalle 3 editační nástroje robot držící ai čip přesunul slova do středu

Dále jsem požádal DALL-E, aby mi pomohl upravit obraz televize zobrazující statickou elektřinu. DALL-E je skvělý pro generování jedinečných obrázků, ale některé detaily se pletou nebo poskytuje zdeformovaný text. V tomto případě informační lišta na televizní obrazovce zobrazuje nesmyslný AI text, takže jsem jej chtěl odstranit. První pokus DALL-E zanechal na informační liště stín, zatímco druhý a třetí pokus byly mnohem čistší. Ne dokonalé, ale dost slušné na to, k čemu jsem obrázek používal.

dalle 3 editační nástroje pro úpravu statické televize
dalle 3 editační nástroje upravující televizi zobrazující statickou elektřinu odstraněnou, ale ponechaný stín
dalle 3 editační nástroje pro úpravu televize zobrazující statickou elektřinu odstraněny
dalle 3 editační nástroje upravující televizi zobrazující statickou elektřinu odstraněny, ale závady
dalle 3 editační nástroje pro úpravu statické televize
dalle 3 editační nástroje upravující televizi zobrazující statickou elektřinu odstraněnou, ale ponechaný stín
dalle 3 editační nástroje pro úpravu televize zobrazující statickou elektřinu odstraněny
dalle 3 editační nástroje upravující televizi zobrazující statickou elektřinu odstraněny, ale závady

Přidávání a změna

DALL-E 3 může provádět určité změny obrázků, ale opět záleží na měřítku toho, co požadujete. Drobné doplňky a změny jsou možné, ale většinu času editační nástroj DALL-E nedokáže zpracovat to, co je požadováno.

Požádal jsem DALL-E, aby „vytvořil 2:1 4k snímek lidského oka zblízka, buďte detailní“, což vedlo k následujícímu obrázku:

dalle 3 editační nástroje zblízka lidské oko

Docela slušné, i když trochu zvláštní (odlesky řas?!), ale chtěl jsem místo toho přepnout barvu duhovky na modrozelenou, což má za následek tento obrázek:

dalle 3 editační nástroje zblízka lidské oko změnilo barvu

Barva je mírně matná, ale nezměněná a některé prvky jsou mírně zdeformované.

Dále jsem vyzval DALL-E, aby „vytvořil 4k 2:1 hliněný obrázek člověka v tygřím onesie lyžujícího po svahu s pozadím yetiho“.

dalle 3 editační nástroje styl tiger yeti claymation

Opět platí, že původní obrázek je dobrý, má ostré, živé barvy a odpovídá výzvě. Chtěl jsem však yetiho změnit na jiný typ děsivého zvířete.

Dalle 3 editační nástroje yeti odstraněny z obrázku

Místo výměny yetiho za jiné zvíře je prostě úplně pryč. Místo toho jsem se vrátil k původnímu obrázku a požádal ho o přidání dalšího yetiho, což se nepodařilo. Podobně selhal, když byl požádán o přidání dalších stromů do obrázku.

Přidání textu

Tady toho není moc co pokrýt. Jak již bylo řečeno, generativní AI obecně s textem stejně bojuje a přidání textu do obrázku je ještě obtížnější. Vyzval jsem DALL-E, aby vytvořil pohlednici z britského pobřeží, což se povedlo a scénu pěkně zachytil. Pak jsem chtěl k obrázku přidat slova „Sunny Beach“, což prostě nezvládlo. To znamená, že po přibližně šesti nebo sedmi výzvách tam a zpět, které DALL-E připomněly, co má udělat, vytvořil zcela nový obrázek s požadovaným textem. A také přesný text; Nejsem si jistý tím dětským obličejem na slunci, mysli.

Ve vztahu :  Je výbuch hlavního specialisty na umělou inteligenci Microsoftu příznakem trhlin ve společnosti OpenAI?
dalle 3 editační nástroje britské přímořské město
dalle 3 editační nástroje britské přímořské město odstraněno racek žádná slova
dalle 3 editační nástroje britské přímořské město změnil obrázek pomocí slov
dalle 3 editační nástroje britské přímořské město
dalle 3 editační nástroje britské přímořské město odstraněno racek žádná slova
dalle 3 editační nástroje britské přímořské město změnil obrázek pomocí slov

Jako další jsem šel pro přání k narozeninám. Tentokrát DALL-E přidal „Happy Birthday“ bez vyzvání, což je vzhledem k tématu v pořádku. Požádal jsem ho tedy o přidání data narozenin na kartu. Opět se nepodařilo přidat datum na kartu, ale po několika kolech výzvy vytvořil nový obrázek s požadovaným datem. V tomto případě by bylo snazší přidat datum sám, zvláště pokud bych chtěl zachovat původní obrázek.

Dalle 3 editační nástroje anime styl přání k narozeninám
dalle 3 editační nástroje anime styl přání k narozeninám s datem přidání
Dalle 3 editační nástroje anime styl přání k narozeninám
dalle 3 editační nástroje anime styl přání k narozeninám s datem přidání

Editační nástroje DALL-E jsou užitečné, ale vyžadují práci (a trochu vytrvalosti)

Zjistil jsem, že editační nástroje DALL-E jsou užitečné pro určité úkoly, ale trvá nějakou dobu, než se správně upraví. Jindy to prostě nebude fungovat a pravděpodobně bude lepší, když vezmete původní výzvu a vyladíte ji, abyste vytvořili nový obrázek.

Editační nástroje DALL-E se pravděpodobně časem zlepší, ale do té doby bude možná lepší upravit obrázek pomocí nástroje pro úpravu obrázků, než absolvovat několik časově náročných kol konverzace s DALL-E. Když to funguje, je to dobré; když to nerozumí nebo neprovede úpravu vůbec, je to frustrující.