Gemini AI získává funkce videogenerátoru Veo 2

V návaznosti na obrázky vytvářené umělou inteligencí se nyní očekává skutečná záplava videí s umělou inteligencí. A Google není jen součástí této revoluce – chce ji vést.

Využití umělé inteligence ke generování obrázků v posledních měsících zaplavilo internet a vytvořilo nejrůznější virální trendy. Nyní však Google hodlá tuto kreativitu rozšířit i do audiovizuální oblasti: společnost zahájila globální nasazení svého nejpokročilejšího modelu videa Veo 2 prostřednictvím Gemini Advanced, své prémiové platformy AI.

Veo 2 vyniká schopností generovat videa ve vysokém rozlišení (720p), s délkou až osm sekund, ve formátu MP4 a poměrem stran 16:9. Tento nástroj umožňuje uživatelům transformovat jednoduché textové popisy do krátkých, realistických a filmových videí.

Vysoká vizuální věrnost a filmový realismus

Veo 2 se od ostatních modelů liší hlubokým pochopením zákonů reálné fyziky a lidského pohybu. To mu umožňuje vytvářet animace s větší plynulostí, soudržností a vizuálními detaily.

Tato technologie, která byla dříve dostupná pouze prostřednictvím Vertex AI nebo VideoFX pro zkušené uživatele, se nyní díky Gemini Advanced dostává k široké veřejnosti, což představuje důležitý krok k demokratizaci videa generovaného umělou inteligencí.

Důraz na bezpečnost a transparentnost

Společnost Google si je vědoma možného zneužití této technologie, a proto zavedla několik ochranných opatření: všechna videa generovaná pomocí technologie Veo 2 obsahují digitální vodoznak vložený do každého snímku pomocí technologie SynthID, který zajišťuje sledovatelnost obsahu.

Systém navíc dokáže odmítnout vytvoření videí, která porušují zásady používání, a to díky důkladné testovací fázi, která zahrnovala cvičení síťových týmů (simulace k odhalení zranitelností).

Kromě Gemini přidala společnost Google k experimentální platformě Whisk i Veo 2, která slouží k vytváření obrázků – a nyní také k jejich animování. Whisk se liší tím, že podporuje nejen textové pokyny, ale také obrázky jako výchozí bod, což umožňuje stylizovat videa na základě předchozího vizuálního odkazu (například snímek s estetikou Studia Ghibli). Tento nástroj však zatím není k dispozici ve Španělsku.

Usnadnění šíření

Jednou ze silných stránek ekosystému Gemini je snadné sdílení vytvořených videí: Google integroval funkce, které umožňují nahrávání obsahu na platformy, jako je TikTok nebo YouTube Shorts, jediným kliknutím z mobilního telefonu, čímž se zvyšuje viralizace výtvorů uživatelů.

Omezení a dostupnost

Prozatím je generování videí pomocí Veo 2 vyhrazeno pro předplatitele tarifu Gemini Advanced (součást Google One AI Premium), což znamená placený model, přinejmenším dokud budou zachovány vysoké výpočetní nároky spojené s audiovizuální tvorbou. Společnost Google neupřesnila, kolik videí lze měsíčně vytvořit, ačkoli ujišťuje, že uživatelé obdrží varování, když se k tomuto limitu přiblíží.

Technologie generování videí pomocí umělé inteligence otevřela nové možnosti v oblasti marketingu, vzdělávání a zábavy. Například firmy mohou efektivněji vytvářet personalizované reklamy, zatímco pedagogové mohou vytvářet poutavý a dynamický vzdělávací obsah pro své studenty. Tato technologie však přináší také etické problémy a problémy s ochranou soukromí, protože existuje značný potenciál pro vytváření falešných nebo zavádějících videí. Je proto zásadní, aby technologické společnosti, jako je Google, pokračovaly ve vývoji bezpečnostních a transparentních opatření, která tato rizika zmírní.