Gemini Live nyní dokáže přijímat audiovizuální kontext, například naši obrazovku nebo to, na co namíříme kameru mobilního telefonu, takže interakce s ním je mnohem lidštější a intuitivnější.
Jedná se pravděpodobně o produkt, o který se Google stará nejvíce a není divu. Umělá inteligence způsobí revoluci ve všem, ať už se k ní giganti v oboru postaví, nebo ne. Můžeme potvrdit, že to v Mountain View myslí vážně, a po představení Gemini 2.5 oznámili také Canvas a Audio Overview, které mají z Gemini udělat nejkreativnější a nejvíce spolupracující AI na trhu. Nyní nás Google sám informuje o nové aktualizaci svého nejpokročilejšího multimodálního modelu, který se pro všechny prémiové předplatné Gemini Advanced, alespoň prozatím, stane lidštějším, pokud jde o porozumění potřebám a kontextům, aby nám nabídl nejvhodnější odpovědi.
Souhrn novinek, které nová Gemini přináší
Pravdou je, že myšlenkou Gemini Live je nyní stát se tím inteligentním společníkem, kterým se Asistentovi nikdy nepodařilo být, i když jeho funkce byly velmi zajímavé již v době, kdy se nepředpokládalo, kam se inteligentní asistenti budou ubírat. Nyní nejpokročilejší konverzační chatbot společnosti Google dokáže mluvit a/nebo chatovat s námi ve více než 45 jazycích ve stoprocentně přirozeném jazyce.
Nejen to, ale i možnost posílat mu audiovizuální obsah, takže může analyzovat obrazovku nebo to, co vidíme kamerou, otevírá umělé inteligenci Googlu mnohem širší kontext a poskytuje nám intuitivnější a užitečnější informace o tom, co potřebujeme v reálném čase.
To, co Google udělal, je, že pokročil v realizaci prototypů, které nám ukázal v rámci svého ambiciózního projektu Astra a umožnil Gemini, aby nám nabídl technickou pomoc tím, že nám poskytne nápady na design a výzdobu, tipy na styling a to i v souvislosti s aktuálním počasím nebo řadu dalších možností.
Je to důležitý krok, že umělá inteligence dokáže porozumět světu kolem nás a komunikovat s ním, a my jsme jistě u tohoto nezbytného prvního kroku, tedy u něčeho, co Google již nyní popisuje jako zjednodušení a obohacení různých úkolů a možností v každodenním životě, které Gemini dokáže díky tomu, že v daném okamžiku rozumí ještě více našim souvislostem a informacím? Je úžasné, jak rychle to všechno postupuje!
Ve skutečnosti je již ode dneška možné sdílet náš fotoaparát nebo obrazovku s Gemini Live, čímž se otevírá svět možností, který bude prozatím k dispozici v prvním náhledu pro všechny uživatele mobilních telefonů Pixel 9 od Googlu, ty, kteří používají některý ze Samsungů Galaxy S25 a samozřejmě, jak jsme již řekli, předplatitele Gemini Advanced.
Význam multimodální umělé inteligence v budoucnosti
Vývoj Gemini směrem k multimodální AI je významným krokem ve vývoji technologií umělé inteligence. Schopnost zpracovávat a chápat více typů dat, jako je text, obrázky a zvuk, umožňuje společnosti Gemini poskytovat přesnější a kontextuálnější odpovědi. To nejen zlepšuje interakci s uživateli, ale také otevírá nové možnosti v oblastech, jako je vzdělávání, zdravotnictví a zábava.
https://twitter.com/vidxie/status/1909464098670325919?v=2
Například v oblasti vzdělávání by Gemini mohl pomoci studentům pochopit složité pojmy tím, že jim vedle textu poskytne i vizuální a zvukové vysvětlení. Ve zdravotnictví by mohl analyzovat lékařské snímky a poskytovat předběžné diagnózy, čímž by pomáhal zdravotníkům činit informovanější rozhodnutí.
Kromě toho by schopnost Gemini komunikovat lidštějším a chápavějším způsobem mohla způsobit revoluci ve způsobu, jakým podniky komunikují se svými zákazníky a nabídnout tak personalizovanější a efektivnější služby zákazníkům.
Cesta k etičtější a odpovědnější umělé inteligenci
S rozvojem technologií, jako je Gemini, je třeba řešit také otázky etiky a ochrany soukromí. Společnost Google potvrdila svůj závazek k odpovědnému vývoji umělé inteligence a zajistila, že aktualizace systému Gemini budou prováděny s důrazem na transparentnost a ochranu údajů uživatelů. Je nezbytné, aby technologické společnosti i nadále pracovaly na zásadách a postupech, které zajistí, že umělá inteligence bude využívána eticky a že uživatelé budou mít kontrolu nad svými osobními údaji.
Závěrem lze říci, že aktualizace Gemini představuje významný pokrok v oblasti umělé inteligence a přibližuje nás k budoucnosti, kdy stroje budou rozumět nejen našim slovům, ale také souvislostem a emocím, které se za nimi skrývají. S důrazem na etiku a odpovědnost mají tyto technologie potenciál pozitivně proměnit náš každodenní život.