V sérii příspěvků na svém oficiálním účtu na Twitteru se generální ředitel společnosti Alphabet Sundar Pichai podělil o nejnovější pokroky a schopnosti, které znamenají začátek toho, co nazývá „érou Gemini 2.0“. První oznámení se točilo kolem Gemini 2.0 Flash, optimalizované verze, která podle Pichaie v klíčových ukazatelích zdvojnásobuje rychlost svého předchůdce Gemini 1.5 Pro. Tento pokrok je obrovským skokem vpřed, pokud jde o efektivitu, a přináší výrazně rychlejší výsledky, aniž by to bylo na úkor kvality odpovědí.
Vývojáři mohou v současné době tuto experimentální verzi zkoumat prostřednictvím platforem AI Studio a Vertex AI, které tyto pokročilé nástroje integrují. Pro běžné uživatele je nyní k dispozici zkušební varianta ve webové aplikaci GeminiApp, přičemž v blízké budoucnosti je přislíbena i mobilní verze.
Hloubkový výzkum a agentační funkce
Nejdůležitějším prvkem verze Gemini 2.0 je zavedení funkcí určených k rozšíření záběru umělé inteligence při analýze a zpracování komplexních informací. Jednou z nejvýraznějších novinek je Deep Research, funkce dostupná v Gemini Advanced, která funguje jako asistent výzkumu.
Podle Pichaie dokáže tento nástroj zkoumat složitá témata a vytvářet podrobné zprávy doplněné odkazy na relevantní zdroje, což je průlom, který by mohl změnit způsob, jakým profesionálové přistupují k výzkumným a analytickým úkolům.
Agenti na bázi umělé inteligence
Podle slov Sundara Pichaie společnost Google „vytváří budoucnost, ve které umělá inteligence nejen rozumí, ale také uvažuje a aktivně jedná jménem uživatelů“. Díky multimodalitě dokáže Gemini 2.0 zpracovávat text, obrázky, zvuk a video současně, což umožňuje „dosud nevídanou úroveň interakce a porozumění“.
Jedním z jeho hlavních pokroků je však to, že představuje krok směrem k automatizaci prostřednictvím agentů, entit schopných autonomně pracovat za účelem splnění konkrétních cílů v různých prostředích. Slovy Demise Hassabise, generálního ředitele společnosti Google DeepMind,
„Rok 2025 považujeme za skutečný začátek éry agentů založených na umělé inteligenci a Gemini 2.0 je základem této budoucnosti.“
Chytré vyhledávání a další vychytávky
Další oblastí, ve které Gemini 2.0 přináší změny, je vyhledávání informací online. Podle Pichaie se pokročilé schopnosti modelu v oblasti uvažování testují prostřednictvím „přehledů AI“ ve vyhledávání Google, které umožňují složitější a jemnější odpovědi na dotazy uživatelů. Podle společnosti Google budou mít tato vylepšení dopad na více než miliardu lidí, kteří vyhledávač denně používají.
Společnost Google dala jasně najevo, že hodlá integrovat Gemini 2.0 prakticky do všech svých produktů a služeb. Gemini 2.0 se stane technologickou páteří společnosti, od vyhledávače až po nástroje jako Google Workspace, Chrome a Android.
Hassabis zdůrazňuje, že cílem tohoto modelu je jednotné řešení, které eliminuje potřebu roztříštěných produktů. Vizí společnosti Google je vytvořit umělou inteligenci, která může sloužit jako základ pro různorodé a komplexní aplikace.
Stěžejní projekty Gemini 2.0
Spuštění modelu Gemini 2.0 doprovází řada projektů, které ukazují potenciál tohoto modelu změnit interakci mezi člověkem a strojem:
- Projekt Astra: Tento agent nabízí pokročilé konverzační schopnosti v několika jazycích, včetně jazykových kombinací a lepšího porozumění přízvuku. Má také rozšířenou paměť schopnou vyvolat až 10 minut kontextu během jedné relace a výrazně zlepšuje latenci.
- Projekt Mariner: Tento agent je navržen k samostatnému provádění složitých úkolů, dokáže procházet internet, vyhledávat informace a vyplňovat formuláře, a to vše přesně a efektivně.
- Jules: Nástroj pro vývojáře, který pomáhá identifikovat a opravovat chyby v kódu. Tento agent se přímo integruje s pracovními postupy na GitHubu, což výrazně usnadňuje produktivitu programátorů.
Bezpečnostní výzvy
Ačkoli je pokrok nepopiratelný, vývoj autonomních agentů vyvolává také otázky týkající se bezpečnostních rizik. Gemini 2.0 již pracuje s určitými bezpečnostními opatřeními, jako je testování v kontrolovaných prostředích („sandboxech“) před jejich nasazením v reálných aplikacích, aby se předešlo potenciálním problémům spojeným s nezávislým fungováním agentů v reálném světě.
Budoucnost umělé inteligence bude záviset na rovnováze mezi inovacemi a bezpečnostními opatřeními, která chrání uživatele a jejich údaje: Google uznává, že je třeba ještě pracovat na tom, aby tito agenti byli užiteční, aniž by ohrozili soukromí a bezpečnost.