Gemini 2.0 je tady. Nejvýkonnější AI od Googlu přináší spoustu novinek

  • 14. 12. 2024
  • Zdroj obrázku: Getty Images / Unsplash
Gemini 2.0 je tady. Nejvýkonnější AI od Googlu přináší spoustu novinek
Po týdnech zvěstí a rostoucích očekávání dnes společnost Google oficiálně představila Gemini 2.0, svůj dosud nejpokročilejší model, což představuje milník v závodě o prvenství v oblasti umělé inteligence.


V sérii příspěvků na svém oficiálním účtu na Twitteru se generální ředitel společnosti Alphabet Sundar Pichai podělil o nejnovější pokroky a schopnosti, které znamenají začátek toho, co nazývá „érou Gemini 2.0“. První oznámení se točilo kolem Gemini 2.0 Flash, optimalizované verze, která podle Pichaie v klíčových ukazatelích zdvojnásobuje rychlost svého předchůdce Gemini 1.5 Pro. Tento pokrok je obrovským skokem vpřed, pokud jde o efektivitu, a přináší výrazně rychlejší výsledky, aniž by to bylo na úkor kvality odpovědí.

Související článek

ChatGPT míří na WhatsApp: Vyzkoušejte si funkce, které oživí jeho používání
ChatGPT míří na WhatsApp: Vyzkoušejte si funkce, které oživí jeho používání

Po obrovském úspěchu aplikace ChatGPT navrhla skupina Španělů nástroj pro WhatsApp s názvem LuzIA, který využívá konverzačního bota OpenAI. Díky němu můžete vědět, co říká audio, aniž byste ho museli poslouchat, protože má možnost přepisu, ke kterému je třeba přidat další výhody, jako je design obrázku nebo všechny odpovědi poskytované ChatGPT. A po dlouhém čekání samotná společnost OpenAI oznámila, že nyní můžete ChatGPT používat v rámci aplikace WhatsApp.

Vývojáři mohou v současné době tuto experimentální verzi zkoumat prostřednictvím platforem AI Studio a Vertex AI, které tyto pokročilé nástroje integrují. Pro běžné uživatele je nyní k dispozici zkušební varianta ve webové aplikaci GeminiApp, přičemž v blízké budoucnosti je přislíbena i mobilní verze.

Hloubkový výzkum a agentační funkce

Nejdůležitějším prvkem verze Gemini 2.0 je zavedení funkcí určených k rozšíření záběru umělé inteligence při analýze a zpracování komplexních informací. Jednou z nejvýraznějších novinek je Deep Research, funkce dostupná v Gemini Advanced, která funguje jako asistent výzkumu.

Podle Pichaie dokáže tento nástroj zkoumat složitá témata a vytvářet podrobné zprávy doplněné odkazy na relevantní zdroje, což je průlom, který by mohl změnit způsob, jakým profesionálové přistupují k výzkumným a analytickým úkolům.

Agenti na bázi umělé inteligence

Podle slov Sundara Pichaie společnost Google „vytváří budoucnost, ve které umělá inteligence nejen rozumí, ale také uvažuje a aktivně jedná jménem uživatelů“. Díky multimodalitě dokáže Gemini 2.0 zpracovávat text, obrázky, zvuk a video současně, což umožňuje „dosud nevídanou úroveň interakce a porozumění“.

Jedním z jeho hlavních pokroků je však to, že představuje krok směrem k automatizaci prostřednictvím agentů, entit schopných autonomně pracovat za účelem splnění konkrétních cílů v různých prostředích. Slovy Demise Hassabise, generálního ředitele společnosti Google DeepMind,

„Rok 2025 považujeme za skutečný začátek éry agentů založených na umělé inteligenci a Gemini 2.0 je základem této budoucnosti.“

Chytré vyhledávání a další vychytávky

Další oblastí, ve které Gemini 2.0 přináší změny, je vyhledávání informací online. Podle Pichaie se pokročilé schopnosti modelu v oblasti uvažování testují prostřednictvím „přehledů AI“ ve vyhledávání Google, které umožňují složitější a jemnější odpovědi na dotazy uživatelů. Podle společnosti Google budou mít tato vylepšení dopad na více než miliardu lidí, kteří vyhledávač denně používají.

Společnost Google dala jasně najevo, že hodlá integrovat Gemini 2.0 prakticky do všech svých produktů a služeb. Gemini 2.0 se stane technologickou páteří společnosti, od vyhledávače až po nástroje jako Google Workspace, Chrome a Android.

Hassabis zdůrazňuje, že cílem tohoto modelu je jednotné řešení, které eliminuje potřebu roztříštěných produktů. Vizí společnosti Google je vytvořit umělou inteligenci, která může sloužit jako základ pro různorodé a komplexní aplikace.

Stěžejní projekty Gemini 2.0

Spuštění modelu Gemini 2.0 doprovází řada projektů, které ukazují potenciál tohoto modelu změnit interakci mezi člověkem a strojem:

  • Projekt Astra: Tento agent nabízí pokročilé konverzační schopnosti v několika jazycích, včetně jazykových kombinací a lepšího porozumění přízvuku. Má také rozšířenou paměť schopnou vyvolat až 10 minut kontextu během jedné relace a výrazně zlepšuje latenci.
  • Projekt Mariner: Tento agent je navržen k samostatnému provádění složitých úkolů, dokáže procházet internet, vyhledávat informace a vyplňovat formuláře, a to vše přesně a efektivně.
  • Jules: Nástroj pro vývojáře, který pomáhá identifikovat a opravovat chyby v kódu. Tento agent se přímo integruje s pracovními postupy na GitHubu, což výrazně usnadňuje produktivitu programátorů.

Bezpečnostní výzvy

Ačkoli je pokrok nepopiratelný, vývoj autonomních agentů vyvolává také otázky týkající se bezpečnostních rizik. Gemini 2.0 již pracuje s určitými bezpečnostními opatřeními, jako je testování v kontrolovaných prostředích („sandboxech“) před jejich nasazením v reálných aplikacích, aby se předešlo potenciálním problémům spojeným s nezávislým fungováním agentů v reálném světě.

Budoucnost umělé inteligence bude záviset na rovnováze mezi inovacemi a bezpečnostními opatřeními, která chrání uživatele a jejich údaje: Google uznává, že je třeba ještě pracovat na tom, aby tito agenti byli užiteční, aniž by ohrozili soukromí a bezpečnost.

Zdroje článku: blog.google.com

#