AI od Googlu generuje obrázky, aniž bychom je museli definovat v textu

Nástroj, který nám má usnadnit generování obrázků pomocí umělé inteligence.

Od roku 2022, kdy do našich životů vtrhly ChatGPT a DALL-E, se exponenciálně objevují nástroje založené na generativní umělé inteligenci. Za pouhé dva roky se toho hodně změnilo a podle toho, jak se vyvíjíme, to vypadá, že jsme ještě nic neviděli.

V rámci experimentálních nástrojů společnosti Google nás zaujal zejména nástroj Whisk. Tato nová hračka od společnosti nám umožňuje smíchat několik obrázků a dát nám výsledek, který přebírá podstatu fotografií, které jsme mu nabídli. Tento nástroj je nyní k dispozici ve 100 nových zemích.

Evropa stále čeká

Existuje mnoho nástrojů pro generování obrázků pomocí podnětů. DALL-E, Stable Diffusion nebo Midjourney otevřely cestu a od té doby známe nespočet webových stránek a platforem, které tento typ nástroje integrují do svých služeb. Dnes má podobný nástroj integrovaný také každý, kdo má mobilní telefon nebo počítač, a to díky službám jako Google Gemini, ChatGPT, Copilot atd.

Tentokrát se však Google chtěl odklonit od výzev a nabídnout nástroj, který se používá ještě snadněji. Nebudete muset nic psát, ale stačí vybrat několik obrázků, které smícháte a získáte výsledek, který vystihuje podstatu všech těchto obrázků.

Google Whisk zatím není v Evropě k dispozici, ale můžeme si ho vyzkoušet, pokud použijeme VPN. Whisk používá dva motory umělé inteligence. První, Gemini, překládá obrázky, které uživatel nahraje, do velmi podrobných popisů. Za druhé je Image 3 kombinací námětu, pozadí a stylu přetváří v nové výtvory.

K tomu stačí přetáhnout obrázky do nástroje a definovat předmět, scénu a styl. Důležité je, kam obrázek zadáte, protože to bude klíčem k získání výsledku, který bude odpovídat tomu, co hledáte. Poté umělá inteligence vygeneruje varianty našeho mixu, a pokud se nám nelíbí, můžeme výsledek vždy upřesnit pomocí textových pokynů. Kromě toho můžeme jako referenci použít některé obrázky se třemi předdefinovanými styly: samolepka, lesklý kolíček a plyš.

Whisk není zamýšlen jako profesionální fotografický nástroj, ale jako způsob, jak může uživatel experimentovat s umělou inteligencí a generováním obrázků mnohem jednodušším způsobem a bez zadávání textu. I když má určitá omezení a výsledky nemusí být vždy přesvědčivé, přesto je to zajímavý přístup, který společnost Google s tímto nástrojem zvolila.

AI od Googlu generuje obrázky, aniž bychom je museli definovat v textu

Evropa stále čeká

Gemini AI vám pomůže procházet obsah na vašich fotkách a videích zálohovaných u Googlu

Google nezůstává v AI závodu pozadu a posiluje vyhledávací schopnosti Gemini

OpenAI má opět problém s autorskými právy. Můžou za to obrázky šířící se sociálními sítěmi

Umělá inteligence zklividuje téměř 80 milionů pracovních pozic, ...

Apple by mohl udělat iPhone bez portů. V cestě mu ale stojí Evro...

Amerika otevřela vodíkový důl, který vydrží po celá milénia...

Japonsko pátrá po autorovi silinice vedoucí nikam

Žijeme uvnitř černé díry? NASA to naznačuje po šokujícím objevu...

Umělá inteligence zklividuje téměř 80 milionů pracovních pozic, tvrdí výzkum. Vytvoří ale více než dvojnásobek

Apple by mohl udělat iPhone bez portů. V cestě mu ale stojí Evropská unie

Amerika otevřela vodíkový důl, který vydrží po celá milénia

Japonsko pátrá po autorovi silinice vedoucí nikam

Umělá inteligence zklividuje téměř 80 milionů pracovních pozic, tvrdí výzkum. Vytvoří ale více než dvojnásobek

Google I/O 2024: Nejdůležitější událost roku společnosti Google má nyní své datum

Nový ASUS ZenFone 11 Ultra: Snapdragon 8 Gen 3 a 144Hz displej, který může konkurovat těm nejlepším

Odlišnost prodává: nového telefonu Nothing Phone (2a) se již dodalo více než 100 000 kusů.

Dokumenty

AI od Googlu generuje obrázky, aniž bychom je museli definovat v textu

Související článek

Umělá inteligence zklividuje téměř 80 milionů pracovních pozic, tvrdí výzkum. Vytvoří ale více než dvojnásobek

Evropa stále čeká

Dokumenty