Kompletní průvodce generováním obrázků pomocí Gemini AI

V tomto průvodci se dozvíte, jak krok za krokem generovat obrázky pomocí aplikace Google Gemini, a to buď z počítače, nebo díky její mobilní aplikaci.

Tento průvodce vysvětluje, jak generovat obrázky pomocí aplikace Google Gemini. V současné době tento chatbot umí vytvářet grafiku z textu díky modelu Image 3. Po provedení mnoha testů s bezplatnou verzí lze potvrdit, že kvalita výsledků je poměrně vysoká. Obecně platí, že generování obrázků je velmi snadné, stačí napsat několik pokynů a přidávat úpravy podle obdržených výsledků. Jak na to? Stačí postupovat podle níže uvedených kroků a získat z Google Gemini více.

Generování obrázků pomocí Gemini krok za krokem

Všechny informace zde uvedené vycházejí ze zkušeností s používáním Gemini na webu z počítače. Nezáleží však na tom, na jaké platformě je umělá inteligence Google využívána. Ať už na mobilním zařízení nebo na počítači, na webu nebo v aplikaci, platforma se chová v podstatě stejně.

Pro zahájení generování obrázků stačí požádat Gemini, aby si něco představila, vygenerovala nebo vytvořila. Tato slovesa se nejlépe hodí k iniciaci výzvy, která spustí použití Image 3, modelu generování obrázků společnosti Google, který je v Gemini zabudován. Příklad žádosti:

Vytvoř obrázek kotěte, které jí zmrzlinu uprostřed evropského města.

Výsledky jsou poměrně dobré. Jedna z prvních věcí, které stojí za povšimnutí, je rozlišení obrázku. Po stažení do počítače nebo jiného zařízení má rozměry 2048×2048 pixelů. To je poměrně velký obrázek s velmi dobrým rozlišením pro použití v různých scénářích, například v dokumentech aplikace Word nebo na obálkách článků.

Po získání prvního obrázku lze snadno přidávat úpravy. Stačí například požádat Gemini o změnu atmosféry:

Dokážeš ho udělat noční?

Výsledek je zajímavý – nyní je na obrázku noc. Kočka je velmi podobná předchozímu obrázku a zmrzlina také. Stejně tak auta vzadu jsou stále klasická, i když nejsou ve stejné pozici. Ani ulice není totožná. Každá úprava generuje nový obrázek od základu, i když zachovává kontext.

Další možností je přidání textu. Lze to udělat hned na začátku, ale podobné prvky je možné přidat i později. Po vytvoření nočního evropského města lze Gemini požádat například o:

Přidej někam neon s nápisem „roztomilá kočička“.

Výsledkem je obrázek s neonem, který efektivně obsahuje požadovaný text. Model nezvolil nic specifického s typografií, ale přizpůsobil ji médiu, na kterém je text napsán – neonovému světlu.

Všechny obrázky jsou uloženy v chatu a v pravém horním rohu se nachází tlačítko pro stažení. Stačí kliknout a stáhnout si některý z vytvořených obrázků. Všechny mají velmi vysoké rozlišení, i když jsou čtvercové, což může být nevýhoda při použití například jako obálka na YouTube. Tento problém lze vyřešit nahráním obrázku do aplikace Canva a úpravou rozměrů podle potřeby.

Další možností je opakování generace s novými podmínkami:

Udělej to prosím ještě jednou ve dne.

Nový obrázek opět zobrazuje kočku v denní scéně, i když je odlišný od původního. Každá úprava přepisuje předchozí odpověď, proto je vhodné stáhnout si obrázek před provedením dalších změn.

Použití existujících obrázků jako základ

Další trik spočívá v použití existujícího obrázku jako základu pro generování nového. V následujícím příkladu byl do aplikace Gemini nahrán jeden z obrázků vygenerovaných modelem Image 3 a zadán požadavek:

Vytvoř podobný obrázek, ale tentokrát na Měsíci.

Výsledek je velmi dobrý – kočka a zmrzlina byly umístěny na Měsíc. Rozměry nemusí být vždy proporční, ale je možné provést další úpravy a přidat detaily. Tato funkce funguje nejen s obrázky vytvořenými umělou inteligencí, ale také s jakoukoli fotografií uloženou v počítači. Stačí ji nahrát a požádat Gemini o vygenerování nového obrázku na základě nahraného materiálu.

Při testování nebyla zjištěna žádná omezení týkající se počtu generovaných obrázků, což je rozdíl oproti jiným podobným službám. Zdá se, že prozatím lze generovat tolik obrázků, kolik je potřeba, nebo alespoň ve velmi velkém množství.