Chcete stabilnú difúziu v HD? Tento generátor umenia AI prináša

Generátory obrázkov AI sú v dnešnej dobe v móde, ale väčšina z nich sa obmedzuje na vytváranie obrázkov s nízkym rozlíšením alebo sa hardvéru minie video pamäť. Teraz existuje (aspoň) jedna oprava: upravená verzia Stable Diffusion s názvom „txt2imghd“.

Nový projekt txt2imghd je založený na režime „GOBIG“ z inej odnože Stable Diffusion, čo je zase model používaný na vytvorenie väčšiny umenia AI, ktoré ste v poslednej dobe pravdepodobne videli. Obrázky vytvorené pomocou txt2imghd môžu byť väčšie ako obrázky vytvorené pomocou väčšiny ostatných generátorov – demo obrázky sú 1536 × 1536, zatiaľ čo Stable Diffusion je zvyčajne obmedzená na 1024 × 768 a predvolená hodnota pre Midjourney je 512 × 512 (s voliteľným zvýšením na 1664 x 1664).

Txt2imghd má šikovný spôsob upscalingu obrázkov. Podľa dokumentácie projektu „vytvára detailné obrázky vo vyššom rozlíšení tak, že najprv vygeneruje obrázok z výzvy, zväčší ho a potom spustí img2img na menších kúskoch zväčšeného obrázka a zmieša výsledok späť do pôvodného obrázka“. Je to šikovné riešenie pre limity grafických kariet, ale ako by ste mohli očakávať, generovanie výsledku trvá dlhšie ako jeden obrázok s nízkym rozlíšením.

Aktualizovaná verzia má zhruba rovnaké systémové požiadavky ako bežná Stable Diffusion, ktorá odporúča grafickú kartu s minimálne 10 GB video pamäte (VRAM). Ak máte záujem si to vyskúšať, môžete model spustiť vo svojom prehliadači (vyžaduje sa bezplatný účet GitHub). Môžete si tiež stiahnuť kód na spustenie na svojom počítači zo zdrojového odkazu nižšie.

Zdroj: GitHub