Generální ředitel společnosti OpenAI Sam Altman nás dnes ráno nadchnul zprávou. A příspěvkem na webu X v němž uvádí, že „generování obrázků ChatGPT“ je nyní k dispozici všem uživatelům, i těm, kteří používají bezplatnou verzi.
Stín aprílového dne (americká verze, která se místo 28. prosince slaví 1. dubna) v nás vzbudil trochu skepse, a tak jsme si chtěli ověřit, zda je to skutečně pravda. Odpověď nebyla taková, jakou jsme očekávali: ano, ale jen napůl pravdivá.
Generování obrázků ChatGPT je nyní k dispozici (s omezeními) všem uživatelům
Minulý týden zaplavily sociální sítě obrázky ve stylu Ghibli, což je jedna z nových funkcí ChatGPT, které se rychle rozšířily a přiměly mnoho uživatelů zaplatit za přístup k této funkci, která byla v té době vyhrazena výhradně pro placené účty. S příchodem dubna se dveře k této funkci otevřely všem uživatelům, i těm, kteří používají bezplatnou verzi ChatGPT, ale radost trvala jen krátce. Přesně tři obrázky. Jakmile je tento limit překročen, objeví se zpráva upozorňující uživatele na konec večírku:
„Dosáhli jste limitu pro vytváření obrázků. Upgradujte na ChatGPT Plus nebo to zkuste znovu za 1 den.“
V současné době stojí tarif Plus 21,99 eur (v přepočtu necelých 550 korun) měsíčně.
Altmanova zpráva nyní zní téměř jako učebnicový clickbait. Ano, tvorba obrázků je nyní dostupná všem uživatelům, ale umožnit nám vytvořit pouze tři obrázky denně zdaleka nesplňuje naše očekávání.
Mazání medu na rty navíc není jedinou nevýhodou, na kterou jsme narazili. Dosud měl generování multimédií na starosti DALL-E 3, nyní je to přímo GPT-4o. To je velmi zajímavý vývoj z hlediska toho, že jeden model dělá všechno, takže uživatel nemusí ručně vybírat, co potřebuje, ale narážíme na problém: je nesmyslně pomalý. Vysoké zatížení serverů OpenAI způsobuje velmi výrazné zpomalení generování obrázků, a to jak pro uživatele zdarma, tak pro ty, kteří si v současné době platí verzi Plus.
Technologie generování obrázků v ChatGPT je založena na pokročilých modelech umělé inteligence, které kombinují zpracování přirozeného jazyka a generování obrázků. GPT-4o, nejnovější verze tohoto modelu, dokáže interpretovat textové popisy a převádět je na vizuální obrázky. Tento proces však vyžaduje značné množství výpočetních zdrojů, což vysvětluje pomalost, s níž se uživatelé setkávají.
Přechod z DALL-E 3 na GPT-4o pro generování obrázků navíc neznamená pouze změnu základní technologie, ale také uživatelské zkušenosti. DALL-E 3 byl navržen speciálně pro zobrazování, zatímco GPT-4o je obecnější model, který integruje více funkcí, včetně generování textu a obrázků. Tato integrace může být z dlouhodobého hlediska výhodná, ale v současné době představuje problém z hlediska výkonu a efektivity.
Pokud jde o omezení používání, OpenAI zavedla omezení, aby zajistila rovnoměrné rozdělení zdrojů mezi všechny uživatele. Tato omezení jsou u bezplatných služeb běžná, aby se zabránilo zneužití a zajistilo se, že systém zůstane přístupný většině uživatelů. Tato omezení však mohou být frustrující i pro ty, kteří chtějí dále zkoumat možnosti nástroje, aniž by se museli zavázat k placenému plánu.
Souhrnně lze říci, že zpřístupnění zobrazování ChatGPT všem uživatelům je sice pozitivním krokem k demokratizaci této technologie, ale současná omezení a problémy s výkonem naznačují, že je třeba ještě zapracovat na optimalizaci uživatelského prostředí. Společnost OpenAI bude pravděpodobně pokračovat v úpravách a vylepšování systému, aby tyto problémy v budoucnu vyřešila.