ChatGPT by se klidně mohl vydávat za člověka. Alespoň to naznačuje jedna vědecká studie

ChatGPT by se klidně mohl vydávat za člověka. Alespoň to naznačuje jedna vědecká studie

Zdá se, že ChatGPT je každým dnem dokonalejší a dokonalejší.

Ve filmu Blade Runner jsme viděli, jak film začínal malým testem lidských skupin, který se snažil určit, zda jsou to určitě lidé, nebo zda jsou to ve skutečnosti roboti. Nyní jsme ve vývoji umělé inteligence dospěli do bodu, kdy začíná být nutné rozlišovat mezi lidmi a roboty, a proto se provádějí studie, zda by se ChatGPT mohl vydávat za člověka, nebo ne. Odpověď je, zdá se, kladná, podívejme se tedy , k jakým závěrům vědecká studie v této situaci dospěla.

Roboti vydávající se za lidi

V rámci tohoto experimentu byly společně s lidskými účastníky testovány tři systémy umělé inteligence – ELIZA, GPT-3.5 a GPT-4. Tyto systémy byly testovány na základě analýzy, která byla provedena na základě výsledků testů. Výsledky ukázaly, že GPT-4 byl v 54 % případů považován za skutečného člověka, čímž více než znatelně překonal systém ELIZA (22 %), ale zaostal za skutečnými lidmi (67 %). Tato zjištění představují první proveditelnou, reálnou a zdokumentovanou ukázku toho, že umělý systém prošel interaktivním Turingovým testem, v němž proti sobě stojí dva hráči – stroj a člověk.

Metodika studie uvažuje o jasné přísnosti, která se snaží empiricky a vědecky prokázat to, co se snažila prozkoumat, takže nelze vytýkat, že by výzkumníci neprovedli svědomitou metodu. Při tom jim pomáhalo 500 účastníků, kteří byli náhodně rozděleni do různých rolí. Rozhovory trvaly 5 minut a probíhaly prostřednictvím chatovacího rozhraní určeného pro tento experiment. V případě GPT-4 a GPT-3.5 byl použit specifický podnět, který modely naučil odpovídat na lidské otázky. Mezitím ELIZA, podstatně méně pokročilá než ostatní modely, sloužila jako test.

Tyto výsledky vyvolaly nesčetné množství důležitých otázek o povaze inteligence a vědomí. Začněme tím, zda je Turingův test skutečně experimentem, který nám umožňuje skutečně užitečným způsobem zjistit, zda je člověk člověkem, či nikoli. Ale to není jediná otázka: vše nasvědčuje tomu, že tento test ve skutečnosti hodnotí schopnost systému napodobovat lidské sociální a jazykové chování.

Impozantní pokrok technologie umělé inteligence v oblasti generování přirozeného jazyka se vzhledem k závěrům tohoto článku zdá být nezadržitelný. Ve skutečnosti právě teď zasévá velmi důležité semínko o online bezpečnosti a schopnosti AI nahradit člověka. Přitom se jedná o technologii, která je stále v plenkách, takže je zapotřebí dalšího výzkumu, a to nejen toho, jak zastavit roboty, kteří se mohou vydávat za lidi, ale i hlubšího zkoumání toho, co je to lidskost a jaké jsou určující rysy, které máme jako druh společné.

Účastníci prováděli různé strategie, které ukázaly, že styl psaní a emocionální aspekty jsou klíčem k určení, zda mají co do činění s robotem, či nikoliv, a tak posoudili lidskost lidí – či nikoliv -, s nimiž hovoří. Typicky ti, kteří chtěli zjistit, s kým mluví, začali s pouhým triviálním tlacháním a pak se stupňovali a snažili se odhalit stroje tím, že se vydali po emotivnějších a lidštějších cestách. To nás může vést k myšlence, že lidé nejsou definováni ani tak tím, co si myslíme, ale tím, co cítíme.

Nedávná studie zveřejněná vědci z Kalifornské univerzity v San Diegu a dostupná ke stažení na stránkách Arxiv.org znovu rozvířila debatu o Turingově testu a jeho důsledcích v době pokročilé umělé inteligence. Tento test, původně navržený legendárním Alanem Turingem v roce 1950, se snaží vyhodnotit schopnost stroje projevit chování, které by mohlo být dokonale vydáváno za chování člověka. To znamená, že by nás mohl vést k domněnce, že komunikujeme s plně lidskou osobou.