Gemini AI dokáže převést PDF na podcast. Trvá jí to jen pár sekund

Gemini AI dokáže převést PDF na podcast. Trvá jí to jen pár sekund

Umělá inteligence Google Gemini v aplikaci NotebookLM dokáže z dokumentů PDF vytvářet konverzační podcasty.

Jde o jeden z nejužitečnějších nástrojů umělé inteligence, které jsou dnes k dispozici. Z nějakého důvodu se však společnost Google rozhodla, že ji do Gemini neintegruje a nebude ji propagovat s důrazem, který si zaslouží. Jmenuje se NotebookLM a je to v podstatě poznámkový blok poháněný AI, který doplňuje jazykové modely rodiny Gemini o informace ze souborů, jako jsou dokumenty PDF, videa nebo texty. Tímto způsobem je možné provádět pokročilé dotazy na dokumentaci, generovat souhrny a mnoho dalšího.

Nedávno také představil možnost generování konverzačních zvukových záznamů prostřednictvím umělé inteligence ve formě podcastů na základě obsahu dokumentů poskytnutých uživatelem. V posledních dnech jsem tuto funkci testoval a upřímně si myslím, že je to to nejlepší, co Google za dlouhou dobu udělal.

Jak Gemini AI v NotebookLM funguje

Funkce zvukového přehledu se v NotebookLM objevila na začátku září a podle Googlu jde o způsob, jak „proměnit vaše dokumenty v zajímavé zvukové diskuze“. Umožňuje vygenerovat zvukovou nahrávku, ve které dva mluvčí diskutují a shrnují zdrojový materiál, vytvářejí souvislosti mezi tématy a dokonce vtipkují.

K tomu stačí, abyste do dokumentu NotebookLM zadali jeden nebo více zdrojů. Odtud lze vygenerovat zvukový souhrn.

V našich testech jsme tuto funkci použili ke generování zvukových shrnutí složitých témat. Výsledky jsou opravdu působivé: umělá inteligence odvádí fantastickou práci při zjednodušování dokumentů, například vědeckých studií, tak, aby byly snadno pochopitelné na praktických příkladech.

I v případě jednodušších témat nebo při použití dokumentů s menším množstvím informací odvádí NotebookLM dobrou práci při extrakci klíčových faktů a generování jasného a stručného zvukového shrnutí.

Není to však samozřejmě spolehlivý nástroj. NotebookLM je stále v experimentální fázi, a proto se může při generování shrnutí dopustit chyb. Má také některá omezení, z nichž nejdůležitější je skutečnost, že dokáže generovat zvuková shrnutí pouze v angličtině. V současné době nástroj nepodporuje více jazyků.

Jak otestovat funkci zvukového přehledu

Přestože zvukové přehledy považujeme za jednu z nejzajímavějších funkcí, zdá se nám, že NotebookLM je v současné době jedním z nejlepších nástrojů pro umělou inteligenci a stojí za to ho používat, i kdyby tuto možnost neobsahoval.

Chcete-li NotebookLM vyzkoušet, stačí přejít na webové stránky nástroje a přihlásit se pomocí účtu Google. Jakmile se tam dostanete, budete muset vytvořit nový zápisník a přidat zdroje (ať už se jedná o webové stránky, soubory PDF, dokumenty na Disku Google, videa nebo texty). Do jednoho zápisníku můžete přidat celkem 50 textů.

Jakmile NotebookLM zpracuje obsah, můžete vygenerovat zvukový souhrn. To provedete klepnutím na tlačítko „Generovat“ vedle položky „Audio summary, in-depth conversation“ (Zvukové shrnutí, hloubková konverzace). Po několika sekundách (nebo minutách, v závislosti na množství přidaných informací) si budete moci zvukový souhrn poslechnout, uložit nebo sdílet s kýmkoli budete chtít.

Zdroje článku: Autorský text