Nejlepších 5 open-source generátorů obrázků pomocí AI

Nejlepších 5 open-source generátorů obrázků pomocí AI

Modely generování textu na obrázek založené na umělé inteligenci jsou všude a jsou denně snadněji přístupné. I když je snadné pouze navštívit web a vygenerovat obrázek, který hledáte, open source generátory textu na obrázek jsou vaší nejlepší volbou, pokud chcete mít větší kontrolu nad procesem generování.

Na internetu jsou k dispozici desítky bezplatných a open source generátorů AI textu na obrázek, které se specializují na konkrétní druhy obrázků. Takže jsme probrali hromadu a našli ty nejlepší generátory textu na obrázek s otevřeným zdrojovým kódem umělé inteligence, které můžete hned teď vyzkoušet.

1Craiyon

Craiyon je jedním z nejsnáze dostupných open-source generátorů AI obrázků. Je založen na DALL-E Mini, a zatímco můžete klonovat úložiště Github a nainstalovat model lokálně na svůj počítač, zdá se, že Craiyon tento přístup upustil ve prospěch svých webových stránek.

Oficiální úložiště Github nebylo aktualizováno od června 2022, ale nejnovější model je stále k dispozici zdarma na oficiálních stránkách Craiyon. Neexistují ani aplikace pro Android nebo iOS.

Pokud jde o funkčnost, uvidíte všechny obvyklé možnosti, které očekáváte od generátoru obrázků AI. Jakmile zadáte výzvu a získáte obrázek, můžete pomocí funkce upscale získat kopii ve vyšším rozlišení. Na výběr jsou tři styly: Art, Photo a Drawing. Můžete také vybrat možnost „Žádný“, pokud chcete, aby rozhodoval model.

craiyon-generated-image

Navíc vám „Expertní režim“ umožňuje zahrnout negativní slova, která modelu sdělují, aby se vyhnul konkrétním položkám. K dispozici je také funkce rychlého předvídání, která využívá ChatGPT k tomu, aby uživatelům pomohla napsat co nejlepší a nejpodrobnější výzvy. A konečně, funkce pro odstranění pozadí s umělou inteligencí vám mohou pomoci ušetřit čas a námahu při ořezávání pozadí z obrázků.

A to je asi všechno, co Craiyon dělá. Není to nejsofistikovanější model generování obrazu AI, ale jako základní model se hodí, pokud nechcete něco detailního nebo realistického.

Model je zdarma k použití, ale bezplatní uživatelé jsou omezeni na devět bezplatných obrázků najednou během jedné minuty. Můžete se přihlásit k odběru jejich úrovní Supporter nebo Professional (ceny 5 USD a 20 USD měsíčně a účtované ročně), abyste nezískali žádné reklamy ani vodoznaky, rychlejší generování a možnost ponechat vygenerované obrázky soukromé. Vlastní úroveň předplatného také umožňuje vlastní modely, integraci, vyhrazenou podporu a soukromé servery.

2Stabilní difúze 1.5

Stable Diffusion je možná jedním z nejpopulárnějších modelů generování textu na obrázek s otevřeným zdrojovým kódem. Pohání také další modely, včetně tří níže zmíněných generátorů obrázků. Byl vydán v roce 2022 a od té doby má mnoho implementací.

stabilní-difúzní-web-ui

Ušetřím vás příliš technických podrobností o tom, jak model funguje (pro které se můžete podívat na jejich oficiální úložiště Github), ale model se snadno instaluje i pro úplné začátečníky a funguje dobře, pokud máte vyhrazené GPU s alespoň 4 GB paměti. Stable Diffusion můžete také přistupovat online a my vám pomůžeme, pokud chcete spustit Stable Diffusion na Macu.

Ve vztahu :  Průvodce nastavením vlastních instrukcí v ChatGPT

Pro Stable Diffusion je k dispozici několik kontrolních bodů (považujte je za verze). Zatímco jsme testovali verzi 1.5, verze 2.1 je také v aktivním vývoji a je přesnější.

dreamshaper-ai-generated-image

Provoz modelu je také poměrně snadný. Testovali jsme s webovým uživatelským rozhraním AUTOMATIC1111 Stable Diffusion a všechny ovládací prvky a parametry fungují dobře. Je to také docela odolné proti NSFW díky databázi LAION-5B, na které model trénoval (ačkoli to není dokonalé, uvědomte si). Zatímco samotná doba generování se bude lišit v závislosti na vašem hardwaru, můžete očekávat, že vaše obrázky budou detailní a realistické i se základními výzvami.

3DreamShaper

DreamShaper je model generování obrazu založený na Stable Diffusion. Byl zamýšlen jako open-source alternativa k MidJourney a zaměřuje se na fotorealismus ve generovaných obrázcích, i když si stejně dobře poradí se styly anime a malby s pár úpravami.

Model je schopnější než Stable Diffusion, což uživatelům umožňuje větší volnost při konečném výstupu, od bleskových vylepšení po volnější omezení NSFW. Spuštění modelu je také snadné, předem připravená verze ke stažení je k dispozici online pro místní přístup a řada webových stránek, včetně Sinkin.ai, RandomSeed a Mage.space (vyžaduje základní předplatné), které umožňují provozovat model s GPU akcelerace.

dreamshaper-stabledifusion-srovnání

Jak už asi tušíte, obrázky generované DreamShaperem mají tendenci vypadat realističtěji ve srovnání se Stable Diffusion. I když spustíte stejnou výzvu na obou modelech, model DreamShaper bude pravděpodobně realističtější, podrobnější a lépe osvětlený.

To platí zejména pro portréty nebo postavy, což je něco, co mi Stable Diffusion ve srovnání se stejnou výzvou chybí. Pokud se vaše obrázky stanou příliš realistickými, zde jsou čtyři způsoby, jak identifikovat obrázek generovaný AI.

Ke spuštění modelu také nepotřebujete monstrózní počítač. Moje GTX 1650Ti s 4GB VRAM běžela model perfektně. Doba generování byla o něco delší, ale nezdálo se, že by to ovlivnilo skutečný výstup. To znamená, že ke spuštění DreamShaper XL, který je založen na modelu Stable Diffusion XL, možná budete potřebovat GPU s více VRAM.

4InvokeAI

Invoke AI je další model generování obrázků založený na AI založený na Stable Diffusion, s XL verzí založenou na Stable Diffusion XL. Má také své vlastní webové uživatelské rozhraní a uživatelské rozhraní příkazového řádku, což znamená, že nebudete muset skákat obruče s věcmi, jako je webové uživatelské rozhraní Stable Diffusion.

invokeai-user-interface-with-image

Model se zaměřuje na to, aby uživatelé mohli vytvářet vizuály na základě jejich duševního vlastnictví s přizpůsobenými pracovními postupy. InvokeAI je jedním z nejlepších modelů generování obrázků s otevřeným zdrojovým kódem pro trénování vlastních modelů a práci s duševním vlastnictvím.

Jeho oficiální úložiště Github uvádí dvě instalační metody: instalaci pomocí instalačního programu InvokeAI nebo pomocí PyPI, pokud vám vyhovuje terminál a Python a potřebujete větší kontrolu nad balíčky nainstalovanými s modelem.

Ve vztahu :  Perplexity Desktop App: Funkce, výhody a detaily o předplatném

Dodatečné ovládání však přináší několik omezení, zejména přísnější hardwarové požadavky. InvokeAI doporučuje vyhrazený GPU s alespoň 4 GB paměti, přičemž pro provoz XL varianty se doporučuje šest až osm GB. Požadavky na VRAM platí pro GPU AMD i Nvidia. Budete také potřebovat alespoň 12 GB RAM a 12 GB volného místa na disku pro model, jeho závislosti a Python.

invoke-ai-generated-image

Přestože dokumentace nedoporučuje GPU řady Nvidia GTX 10 Series a 16 Series pro jejich nedostatek video paměti, poskytnutý instalační program fungoval v pořádku. I když se váš počet najetých kilometrů může lišit, pokud používáte GPU nižší třídy, počítejte s tím, že počkáte déle, než se vaše výzvy změní na obrázky. A konečně, pokud používáte Windows, můžete použít pouze GPU Nvidia, protože v současné době neexistuje žádná podpora pro GPU AMD.

Pokud jde o část generování obrazu, model inklinuje spíše k uměleckým stylům než k fotorealismu. Samozřejmě můžete model trénovat na své datové sadě a nechat jej generovat obrázky blíže k tomu, co chcete, i když to zahrnuje fotorealistické obrázky, zejména pokud pracujete v produktovém designu, architektuře nebo maloobchodních prostorech. Jedna důležitá věc, kterou je třeba mít na paměti, je, že InvokeAI je primárně engine pro generování obrázků, což znamená, že pro dosažení nejlepších výsledků budete pravděpodobně muset používat své vlastní modely (snadno je najdete prostřednictvím správce modelů ve webovém rozhraní) jako výchozí. model je velmi podobný samotnému Stable Diffusion.

5Openjourney

Openjourney je bezplatný model generování obrázků AI s otevřeným zdrojovým kódem založený opět na Stable Diffusion. Pokud vás zajímá, proč se model nazývá Openjourney, je to proto, že byl trénován na snímcích Midjourney a dokáže napodobit svůj styl v obrázcích, které generuje.

PromptHero, společnost stojící za Openjourney, vám umožňuje testovat model spolu s dalšími modely, včetně Stable Diffusion (verze 1.5 a 2), DreamShaper a Realistic Vision. Při registraci získáte 25 bezplatných kreditů (jeden kredit za každý vygenerovaný obrázek), poté se musíte přihlásit k odběru jejich úrovně předplatného Pro, které stojí 9 $ měsíčně a poskytuje vám přístup k 300 kreditům každý měsíc s dalšími exkluzivními funkcemi.

openjourney-stabledifusion-comparson

Pokud jej však chcete spustit lokálně a zdarma, můžete si stáhnout soubor modelu z HuggingFace a spustit jej pomocí webového uživatelského rozhraní Stable Diffusion. Openjourney je také druhým nejstahovanějším modelem generování obrázků AI na HuggingFace, hned za Stable Diffusion.

Openjourney na svých stránkách neuvádí žádné konkrétní hardwarové požadavky pro lokální spuštění modelu, ale můžete očekávat podobné hardwarové požadavky jako Stable Diffusion. To znamená vyhrazený GPU se 4 GB VRAM, 16 GB RAM a přibližně 12 až 15 GB volného místa v počítači pro uložení modelu a jeho závislostí.

openjourney-ai-generated-image

Obrázky generované Openjourney bývají vyvážené mezi fotorealismem a uměním, pokud není uvedeno jinak. Pokud hledáte všestranný model a dáváte přednost vzhledu a chování Midjourney, aniž byste museli platit za předplatné, Openjourney je jednou z nejlepších možností.