Google posouvá hranice kreativity s novými AI nástroji Canvas a Audio Overview pro Gemini

Umělá inteligence Googlu přidává interaktivní prostor pro vytváření obsahu a funkci, která transformuje dokumenty do mluvených konverzací podobných podcastům.

Společnost Google rozšiřuje možnosti asistenta Gemini o dvě nové funkce, jejichž cílem je vybojovat si mezeru na konkurenčním trhu asistentů umělé inteligence. Tyto nové funkce přicházejí v době, kdy se zdá, že boj o nabídku nejlepších nástrojů umělé inteligence nemá konce, stejně jako nemá konce posedlost výrobců přimět uživatele, aby je používali, ať už chceme, nebo ne.

Potvrdila to i samotná společnost Google, která tyto funkce spouští pro všechny uživatele aplikací Gemini a Gemini Advanced, i když s dočasným jazykovým omezením pro aplikaci Audio Overview.

Digitální plátno pro vaše nápady a dokumenty

Canvas je prezentován jako interaktivní prostor, kde můžete tvarovat dokumenty a kód, aniž byste museli přepínat aplikace. Nástroj umožňuje vytvářet počáteční návrhy, které lze následně vylepšovat pomocí návrhů umělé inteligence, což bude důvěrně známé těm, kteří podobné funkce vyzkoušeli v jiných průvodcích.

https://twitter.com/GeminiApp/status/1902028904342102196

Vývojářům Canvas usnadňuje rychlé vytváření prototypů webových aplikací a skriptů v jazyce Python s možností náhledu výsledků před nasazením. Integrace s Dokumenty Google přidává plusový bod těm, kteří již ekosystém Google používají, a umožňuje exportovat obsah jedním kliknutím.

Další předností Canvasu jsou nástroje pro rychlé úpravy, které umožňují upravovat konkrétní části dokumentu úpravou tónu, délky nebo formátování podle potřeby. Tato flexibilita má vyhovovat jak běžným uživatelům, tak profesionálům, kteří vyžadují větší přesnost svých výtvorů.

Tato nová funkce přichází jen několik měsíců poté, co se na YouTube objevila funkce Gemini, která uživatelům umožňuje klást dotazy k videím, což uživatelé této platformy přijali velmi pozitivně. Canvas je nyní k dispozici ve všech jazycích podporovaných službou Gemini, což je výhoda oproti jiným funkcím, které obvykle přicházejí nejprve v angličtině, jako tomu bylo v případě služby Gemini Live.

Gemini se stává opět šikovnější

Funkce Audio Overview promění jakýkoli dokument nebo prezentaci v konverzaci ve stylu podcastu mezi dvěma postavami s umělou inteligencí a nabízí tak alternativní způsob konzumace informací při plnění jiných úkolů. Funkce, importovaná z NotebookLM, generuje dialogy, které shrnují obsah a zdůrazňují hlavní myšlenky.

Funguje to jednoduše: když do Gemini načtete dokument, prezentaci nebo zprávu, možnost Audio Overview vám umožní transformovat ji do mluvené konverzace. Dvě virtuální postavy diskutují o obsahu, vytvářejí souvislosti mezi pojmy a nabízejí doplňující se pohledy na prezentované informace.

Tato funkce by mohla být užitečná zejména pro studenty nebo odborníky, kteří si potřebují prohlédnout materiál na cestách nebo při jiných činnostech, ačkoli je v současné době k dispozici pouze v angličtině, v blízké budoucnosti se plánuje rozšíření na další jazyky.

Spuštění se shoduje s nedávným příchodem aplikace Gemini na iOS, čímž se dokončuje multiplatformní přítomnost, o kterou Google pro svého asistenta s umělou inteligencí usiloval. Tento vývoj také doplňuje jedinečné funkce, které společnost Google představila s telefonem Samsung Galaxy S25, jako jsou například funkce multitaskingu, které umožňují provádět více akcí současně v různých aplikacích.

Prozatím se zdá, že se Google soustředí na přidávání praktických funkcí do Gemini, protože pracuje na globálním rozšíření jeho funkcí. Uvidíme, zda tyto nové funkce přilákají nové uživatele, nebo zůstanou zajímavými, ale málo využívanými nástroji na stále přeplněnějším trhu s umělou inteligencí.