Gemini AI získává funkce videogenerátoru Veo 2

  • 19. 4. 2025
  • Zdroj obrázku: Stock_Market_Visuals / Depositphotos
Gemini AI získává funkce videogenerátoru Veo 2
V návaznosti na obrázky vytvářené umělou inteligencí se nyní očekává skutečná záplava videí s umělou inteligencí. A Google není jen součástí této revoluce – chce ji vést.


Využití umělé inteligence ke generování obrázků v posledních měsících zaplavilo internet a vytvořilo nejrůznější virální trendy. Nyní však Google hodlá tuto kreativitu rozšířit i do audiovizuální oblasti: společnost zahájila globální nasazení svého nejpokročilejšího modelu videa Veo 2 prostřednictvím Gemini Advanced, své prémiové platformy AI.

Veo 2 vyniká schopností generovat videa ve vysokém rozlišení (720p), s délkou až osm sekund, ve formátu MP4 a poměrem stran 16:9. Tento nástroj umožňuje uživatelům transformovat jednoduché textové popisy do krátkých, realistických a filmových videí.

Související článek

Sam Altman přiznal, že jeho umělá inteligence je nesnesitelná
Sam Altman přiznal, že jeho umělá inteligence je nesnesitelná

Generální ředitel OpenAI přiznává, že poslední aktualizace změnila ChatGPT v nesnesitelného patolízala, a slibuje, že napraví jeho přílišnou servilitu a podlézavost.

Vysoká vizuální věrnost a filmový realismus

Veo 2 se od ostatních modelů liší hlubokým pochopením zákonů reálné fyziky a lidského pohybu. To mu umožňuje vytvářet animace s větší plynulostí, soudržností a vizuálními detaily.

Tato technologie, která byla dříve dostupná pouze prostřednictvím Vertex AI nebo VideoFX pro zkušené uživatele, se nyní díky Gemini Advanced dostává k široké veřejnosti, což představuje důležitý krok k demokratizaci videa generovaného umělou inteligencí.

Důraz na bezpečnost a transparentnost

Společnost Google si je vědoma možného zneužití této technologie, a proto zavedla několik ochranných opatření: všechna videa generovaná pomocí technologie Veo 2 obsahují digitální vodoznak vložený do každého snímku pomocí technologie SynthID, který zajišťuje sledovatelnost obsahu.

Systém navíc dokáže odmítnout vytvoření videí, která porušují zásady používání, a to díky důkladné testovací fázi, která zahrnovala cvičení síťových týmů (simulace k odhalení zranitelností).

Kromě Gemini přidala společnost Google k experimentální platformě Whisk i Veo 2, která slouží k vytváření obrázků – a nyní také k jejich animování. Whisk se liší tím, že podporuje nejen textové pokyny, ale také obrázky jako výchozí bod, což umožňuje stylizovat videa na základě předchozího vizuálního odkazu (například snímek s estetikou Studia Ghibli). Tento nástroj však zatím není k dispozici ve Španělsku.

Usnadnění šíření

Jednou ze silných stránek ekosystému Gemini je snadné sdílení vytvořených videí: Google integroval funkce, které umožňují nahrávání obsahu na platformy, jako je TikTok nebo YouTube Shorts, jediným kliknutím z mobilního telefonu, čímž se zvyšuje viralizace výtvorů uživatelů.

Omezení a dostupnost

Prozatím je generování videí pomocí Veo 2 vyhrazeno pro předplatitele tarifu Gemini Advanced (součást Google One AI Premium), což znamená placený model, přinejmenším dokud budou zachovány vysoké výpočetní nároky spojené s audiovizuální tvorbou. Společnost Google neupřesnila, kolik videí lze měsíčně vytvořit, ačkoli ujišťuje, že uživatelé obdrží varování, když se k tomuto limitu přiblíží.

Technologie generování videí pomocí umělé inteligence otevřela nové možnosti v oblasti marketingu, vzdělávání a zábavy. Například firmy mohou efektivněji vytvářet personalizované reklamy, zatímco pedagogové mohou vytvářet poutavý a dynamický vzdělávací obsah pro své studenty. Tato technologie však přináší také etické problémy a problémy s ochranou soukromí, protože existuje značný potenciál pro vytváření falešných nebo zavádějících videí. Je proto zásadní, aby technologické společnosti, jako je Google, pokračovaly ve vývoji bezpečnostních a transparentních opatření, která tato rizika zmírní.

Zdroje článku:
deepmind.google

#