Ako spustiť stabilnú difúziu na vašom počítači na generovanie obrázkov AI


Zhrnutie: Ak chcete spustiť Stable Diffusion lokálne na vašom PC, stiahnite si Stable Diffusion z GitHub a najnovšie kontrolné body z HuggingFace.co a nainštalujte ich. Potom spustite Stable Diffusion v špeciálnom prostredí pythonu pomocou Miniconda.

Umenie umelej inteligencie (AI) je momentálne v móde, no väčšina generátorov obrázkov AI beží v cloude. Stabilná difúzia je iná – môžete ju spustiť na svojom vlastnom počítači a generovať toľko obrázkov, koľko chcete. Tu je návod, ako môžete nainštalovať a používať Stable Diffusion v systéme Windows.

Čo je stabilná difúzia?

Stable Diffusion je model strojového učenia s otvoreným zdrojom, ktorý dokáže generovať obrázky z textu, upravovať obrázky na základe textu alebo vypĺňať detaily na obrázkoch s nízkym rozlíšením alebo málo detailmi. Bol trénovaný na miliardách obrázkov a dokáže produkovať výsledky, ktoré sú porovnateľné s tými, ktoré by ste získali z DALL-E 2 a MidJourney. Je vyvinutý spoločnosťou Stability AI a prvýkrát bol verejne vydaný 22. augusta 2022.

Stable Diffusion (zatiaľ) nemá prehľadné používateľské rozhranie ako niektoré generátory obrázkov AI, ale má mimoriadne tolerantnú licenciu a – čo je najlepšie – je úplne zadarmo na použitie na vašom vlastnom počítači (alebo počítači Mac).

Nenechajte sa zastrašiť skutočnosťou, že Stable Diffusion v súčasnosti beží v rozhraní príkazového riadka (CLI). Uvedenie do prevádzky je celkom jednoduché. Ak môžete dvakrát kliknúť na spustiteľný súbor a zadať do poľa, môžete ho spustiť za pár minút.

Čo potrebujete na spustenie stabilnej difúzie na vašom počítači?

Stable Diffusion nebude fungovať na vašom telefóne ani na väčšine notebookov, ale bude fungovať na priemernom hernom počítači v roku 2022. Tu sú požiadavky:

  • GPU s aspoň 6 gigabajtmi (GB) pamäte VRAM
    • To zahŕňa najmodernejšie GPU NVIDIA

    • Stable Diffusion je možné spustiť aj v systémoch Linux a macOS

    Ak nemáte hardvér, zvážte použitie webového generátora obrázkov AI. Môžete dokonca spustiť demo Stable Diffusion na webe.

    Ako nainštalovať a spustiť stabilnú difúziu v systéme Windows

    Potrebujete dva softvéry: Git a Miniconda3.

    Inštalácia Git

    Git je nástroj, ktorý umožňuje vývojárom spravovať rôzne verzie softvéru, ktorý vyvíjajú. Môžu súčasne udržiavať viacero verzií softvéru, na ktorom pracujú, v centrálnom úložisku a umožniť ostatným vývojárom prispievať do projektu.

    Ak nie ste vývojár, Git poskytuje pohodlný spôsob prístupu k týmto projektom a ich sťahovania, a tak ho v tomto prípade použijeme. Stiahnite si inštalačný program Windows x64 z webovej lokality Git a potom ho spustite a nainštalujte Git.

    Existuje niekoľko možností, ktoré budete vyzvaní vybrať počas spustenia inštalačného programu – ponechajte ich v predvolených nastaveniach. Jedna stránka s možnosťou „Úprava prostredia PATH“ je obzvlášť dôležitá. Musí byť nastavené na „Git z príkazového riadku a tiež zo softvéru tretej strany“.

    Inštalácia Miniconda3

    Stable Diffusion čerpá z niekoľkých rôznych knižníc Pythonu. Ak toho o Pythone veľa neviete, nerobte si starosti – stačí povedať, že knižnice sú len softvérové balíky, ktoré môže váš počítač použiť na vykonávanie špecifických funkcií, ako je napríklad transformácia obrázka alebo komplexná matematika.

    Miniconda3 je v podstate pohodlný nástroj. Umožňuje vám stiahnuť, nainštalovať a spravovať všetky knižnice potrebné na fungovanie Stable Diffusion bez veľkého manuálneho zásahu. Bude to tiež to, ako skutočne používame stabilnú difúziu.

    Prejdite na stránku sťahovania Miniconda3 a kliknite na „Miniconda3 Windows 64-bit“, aby ste získali najnovší inštalačný program.

    Po stiahnutí dvakrát kliknite na spustiteľný súbor, čím spustíte inštaláciu. Inštalácia Miniconda3 zahŕňa menej preklikávania stránkami ako Git, ale musíte si dávať pozor na túto možnosť:

    Pred kliknutím na tlačidlo Ďalej a dokončením inštalácie sa uistite, že ste vybrali možnosť Všetci používatelia.

    Po inštalácii Git a Miniconda3 sa zobrazí výzva na reštartovanie počítača. Nepovažovali sme to za potrebné, ale nebude to bolieť, ak to urobíte.

    Stiahnite si úložisko Stable Diffusion GitHub a najnovší kontrolný bod

    Teraz, keď sme nainštalovali potrebný softvér, sme pripravení stiahnuť a nainštalovať Stable Diffusion.

    Najprv si stiahnite najnovší kontrolný bod – verzia 1.4 má takmer 5 GB, takže to môže chvíľu trvať. Na stiahnutie kontrolného bodu si musíte vytvoriť účet, ale vyžadujú iba meno a e-mailovú adresu. Všetko ostatné je voliteľné.

    Kliknutím na „sd-v1-4.ckpt“ spustíte sťahovanie.

    Potom si musíte stiahnuť Stable Diffusion z GitHub. Kliknite na zelené tlačidlo „Kód“ a potom kliknite na „Stiahnuť ZIP“. Prípadne môžete použiť tento priamy odkaz na stiahnutie.

    Teraz musíme pripraviť niekoľko priečinkov, do ktorých rozbalíme všetky súbory Stable Diffusion. Kliknite na tlačidlo Štart a do vyhľadávacieho panela ponuky Štart napíšte „miniconda3“ a potom kliknite na „Otvoriť“ alebo stlačte Enter.

    Pomocou príkazového riadku vytvoríme priečinok s názvom „stabilná difúzia“. Skopírujte a prilepte blok kódu nižšie do okna Miniconda3 a stlačte Enter.

    cd C:/
    mkdir stable-diffusion
    cd stable-diffusion

    Ak všetko prebehlo dobre, uvidíte niečo takéto:

    Nechajte okno Miniconda3 otvorené, o minútu ho budeme potrebovať znova.

    Otvorte súbor ZIP „stable-diffusion-main.zip“, ktorý ste si stiahli z GitHub vo svojom obľúbenom programe na archiváciu súborov. Prípadne môže systém Windows otvárať súbory ZIP aj sám, ak žiadny nemáte. Ponechajte súbor ZIP otvorený v jednom okne, potom otvorte ďalšie okno Prieskumníka a prejdite do priečinka „C:\stable-diffusion“, ktorý sme práve vytvorili.

    Presuňte priečinok v súbore ZIP „stable-diffusion-main“ do priečinka „stable-diffusion“.

    Vráťte sa do Miniconda3, potom skopírujte a prilepte nasledujúce príkazy do okna:

    cd C:\stable-diffusion\stable-diffusion-main
    conda env create -f environment.yaml
    conda activate ldm
    mkdir models\ldm\stable-diffusion-v1

    Neprerušujte tento proces. Niektoré súbory sú väčšie ako gigabajt, takže sťahovanie môže chvíľu trvať. Ak proces náhodne prerušíte, budete musieť odstrániť priečinok prostredia a znova spustiť príkaz conda env create -f environment.yaml . Ak sa tak stane, prejdite na „C:\Users\(Váš používateľský účet)\.conda nvs“ a odstráňte priečinok „ldm“ a potom spustite predchádzajúci príkaz.

    Riadky, ktoré sme spustili, vytvorili nové prostredie s názvom „ldm“, stiahli a nainštalovali všetky potrebné knižnice Pythonu na fungovanie Stable Diffusion, aktivovali prostredie ldm a potom zmenili adresár na nový priečinok. Sme v poslednom kroku inštalácie. V Prieskumníkovi súborov prejdite na „C:\stable-diffusion\stable-diffusion-main\models\ldm\stable-diffusion-v1“, potom skopírujte a prilepte súbor kontrolného bodu (sd-v1-4.ckpt) do priečinka.

    Počkajte na dokončenie prenosu súboru, kliknite pravým tlačidlom myši na „sd-v1-4.ckpt“ a potom kliknite na „Premenovať“. Do zvýrazneného poľa zadajte „model.ckpt“ a potom stlačením klávesu Enter zmeňte názov súboru.

    A to je všetko – máme hotovo. Teraz sme pripravení skutočne použiť stabilnú difúziu.

    Ako používať stabilnú difúziu

    Prostredie ldm, ktoré sme vytvorili, je nevyhnutné a musíte ho aktivovať kedykoľvek, keď chcete použiť Stable Diffusion. Do okna Miniconda3 zadajte conda activate ldm a stlačte „Enter“. Symbol (ldm) na ľavej strane znamená, že prostredie ldm je aktívne.

    Potom musíme zmeniť adresár (teda príkazcd) na „C:\stable-diffusion\stable-diffusion-main“, aby sme mohli generovať obrázky. Prilepte cd C:\stable-diffusion\stable-diffusion-main do príkazového riadka.

    Ako vytvoriť obrázok so stabilnou difúziou

    Budeme volať skript, txt2img.py, ktorý nám umožňuje konvertovať textové výzvy na obrázky 512 × 512. Tu je príklad. Vyskúšajte toto, aby ste sa uistili, že všetko funguje správne:

    python scripts/txt2img.py --prompt "a close-up portrait of a cat by pablo picasso, vivid, abstract art, colorful, vibrant" --plms --n_iter 5 --n_samples 1

    Vaša konzola vám pri vytváraní obrázkov poskytne indikátor priebehu.

    Tento príkaz vytvorí päť obrázkov mačiek, všetky umiestnené na „C:\stable-diffusion\stable-diffusion-main\outputs xt2img-samples\samples“.

    Nie je dokonalý, ale zreteľne pripomína štýl Pabla Picassa, presne ako sme uviedli vo výzve. Vaše obrázky by mali vyzerať podobne, ale nie nevyhnutne identicky.

    Kedykoľvek budete chcieť zmeniť generovaný obrázok, stačí zmeniť text v úvodzovkách za --prompt.

    python scripts/txt2img.py --prompt "YOUR, DESCRIPTIONS, GO, HERE" --plms --n_iter 5 --n_samples 1

    Povedzme, že sme chceli vytvoriť realisticky vyzerajúceho gophera v magickom lese s čarodejníckym klobúkom. Môžeme skúsiť príkaz:

    python scripts/txt2img.py --prompt "a photograph of a gopher wearing a wizard hat in a forest, vivid, photorealistic, magical, fantasy, 8K UHD, photography" --plms --n_iter 5 --n_samples 1

    Je to naozaj také jednoduché – opíšte, čo chcete, čo najkonkrétnejšie. Ak chcete niečo fotorealistické, nezabudnite zahrnúť výrazy týkajúce sa realistického obrazu. Ak chcete niečo inšpirované štýlom konkrétneho umelca, uveďte umelca.

    Stabilná difúzia sa neobmedzuje len na portréty a zvieratá, dokáže vytvoriť aj pozoruhodné krajiny.

    Čo znamenajú argumenty v príkaze?

    Stable Diffusion má obrovské množstvo nastavení a argumentov, ktoré môžete poskytnúť na prispôsobenie svojich výsledkov. Tých niekoľko, ktoré sú tu uvedené, je v podstate potrebných na to, aby sa zabezpečilo, že Stable Diffusion bude fungovať na priemernom hernom počítači.

    • –plms — Určuje, ako budú obrázky vzorkované. Je o tom papier, ak si chcete pozrieť matematiku.
    • –n_iter — určuje počet iterácií, ktoré chcete vygenerovať pre každú výzvu. 5 je slušné číslo na to, aby ste videli, aké výsledky dosahujete.
    • –n_samples — určuje počet vzoriek, ktoré sa vygenerujú. Predvolená hodnota je 3, ale väčšina počítačov nemá dostatok pamäte VRAM, aby to podporovala. Držte sa 1, pokiaľ nemáte konkrétny dôvod na jej zmenu.

    Samozrejme, Stable Diffusion má množstvo rôznych argumentov, ktoré môžete použiť na vyladenie svojich výsledkov. Spustite python scripts/txt2img.py --help a získate vyčerpávajúci zoznam argumentov, ktoré môžete použiť.

    Dosiahnutie skvelých výsledkov zahŕňa množstvo pokusov a omylov, ale to je aspoň polovica zábavy. Nezabudnite si zapísať alebo uložiť argumenty a popisy, ktoré vrátia výsledky, ktoré sa vám páčia. Ak nechcete robiť všetky experimenty sami, na Reddite (a inde) existujú rastúce komunity, ktoré sa venujú výmene obrázkov a výziev, ktoré ich vygenerovali.