Umělá inteligence se tváří superchytře, nedokáže ale to, co už dnes umí i malé děti

Umělá inteligence se tváří superchytře, nedokáže ale to, co už dnes umí i malé děti

Současné generativní modely AI jsou jistě výkonné, ale mají také své problémy. Některé z nich totiž nejsou schopny číst analogové hodiny.


Všichni už víme, že umělá inteligence způsobí v naší společnosti revoluci, která je zatím téměř nepředstavitelná, i když při čtení odborníků vidíme, kam se věci ubírají, a je proto logické, že se téměř všichni obávají o naše pracovní místa a způsob života. Ne nadarmo sám Bill Gates přiznává, že „umělá inteligence nahradí téměř vše“ v bližší budoucnosti, než bychom si přáli, a v kratší době, než se lidé budou muset gigantické změně přizpůsobit.

V každém případě současné velké multimodální jazykové modely (MLLM), které již začínáme masově používat v osobních počítačích, chytrých telefonech a dalších zařízeních, mají zásadní nedostatky, které bude třeba odstranit, pokud mají být v blízké budoucnosti integrovány do nejrůznějších reálných aplikací.

Současné AI modely jsou velmi výkonné, některé základní úlohy jim ale stále nejdou

Je zajímavé, jak jisté univerzitní studie, v tomto případě provedené ve skotském Edinburghu, tvrdí, že ačkoli většina lidských dětí ve věku kolem pěti, šesti nebo sedmi let se bez problémů naučí číst čas na analogových hodinách, je to něco, co většina nám známých multimodálních modelů dlouhého jazyka nedokáže, a že jsou zřejmě schopny číst hodiny jen s přibližně 25% úspěšností.

Související článek

Microsoft láká uživatele na kurzy práce s AI. Víme, jak se přihlásit
Microsoft láká uživatele na kurzy práce s AI. Víme, jak se přihlásit

Společnost Microsoft včera zahájila svůj AI Skills Fest, padesátidenní celosvětovou vzdělávací akci, která začala 8. dubna 2025 a potrvá do 28. května a nabízí širokou škálu kurzů a interaktivních aktivit, jejichž cílem je demokratizovat přístup k dovednostem souvisejícím s AI pro účastníky na všech úrovních a ve všech odvětvích, překlenout digitální propast a zároveň zvýšit jejich zaměstnatelnost.

Odborníci tvrdí, že pro tak základní úkoly, jako je čtení času, je Gemini od Googlu nejlepší ze všech, i když ani jeho výsledky nebyly zrovna lichotivé:

„Výzkumníci testovali různé designy hodin, včetně některých s římskými číslicemi, se sekundovými ručičkami i bez nich a s různě barevnými ciferníky. Jejich zjištění ukazují, že systémy umělé inteligence v nejlepším případě správně určily polohu ručiček v méně než čtvrtině případů. Chyby byly častější, když měly hodinky římské číslice nebo stylizované ručičky.“

Všechny současné umělé inteligence mají při čtení ručiček potíže s kombinací aspektů, jako je kontext, matematika nebo prostorové vnímání, což je základ, pokud mají převést čas na analogových hodinách na data nebo proměnné, se kterými mohou tyto aplikace pracovat.

Ve skutečnosti se jedná o zásadní nedostatek, protože v den, kdy budou tyto systémy umělé inteligence konečně integrovány do všech druhů aplikací po celém světě , budou muset být schopny číst hodiny a provádět tyto druhy základních úkolů, zejména proto, že plánování, automatizace a některé asistenční implementace částečně závisí na tom, zda umělá inteligence dokáže spolehlivě zpracovávat časové rozvrhy.

Nejhorší pro AI jsou totiž designové hodiny s méně klasicky stylizovanými ručičkami, stejně jako ty s římskými číslicemi nebo jakýmikoli estetickými ozdobami. Jiné studie z Oxfordské univerzity však testovaly model AI speciálně vycvičený na milionech analogových ciferníků hodinek, který nabízí přesnost kolem 75 %, i když zatím bez uvedení přílišných podrobností… Budeme muset zůstat naladěni!

Jak nám řekli kolegové z Futurismu, některé problémy, které představují Gemini nebo ChatGPT, mimo jiné i další možnosti v oboru, jsou opravdu trapné a faktem je, že tyto modely ve skutečnosti nejsou schopny zvládnout tak základní úkoly, jako je správné čtení analogových hodinek, což se my lidé učíme už v 5 nebo 6 letech.

Proč je pro AI tak obtížné číst analogové hodiny

Neschopnost umělé inteligence číst analogové hodiny není jen problémem programování, ale souvisí se způsobem, jakým tyto systémy chápou svět. Modely umělé inteligence, stejně jako velké jazykové modely, jsou navrženy tak, aby zpracovávaly a generovaly text, ale vizuální interpretace je úplně jiná výzva. Podle časopisu Nature vyžaduje vizuální vnímání hluboké porozumění kontextu, což je něco, co umělé inteligence stále vyvíjejí.

Čtení analogových hodin navíc zahrnuje interpretaci relativní prostorové polohy, což je pro současné umělé inteligence značná výzva. Prostorové vnímání a interpretace času jsou dovednosti, které si lidé osvojují na základě zkušeností a interakce s fyzickým světem, což je něco, co umělé inteligence nezažívají stejným způsobem.

Budoucnost umělé inteligence v každodenních úlohách

Navzdory těmto omezením pokrok v oblasti umělé inteligence pokračuje rychlým tempem. Výzkumníci po celém světě pracují na zlepšení schopnosti umělé inteligence provádět každodenní úkoly, jako je například čtení analogových hodin. Časem se pravděpodobně dočkáme výrazného zlepšení schopnosti umělé inteligence provádět tyto úkoly, což otevře nové možnosti jejího začlenění do reálných aplikací.

Závěrem lze říci, že ačkoli má umělá inteligence před sebou ještě dlouhou cestu, než bude schopna provádět základní úkoly se stejnou přesností jako lidé, pokrok v této oblasti je slibný. Časem se pravděpodobně dočkáme větší integrace umělé inteligence do našeho každodenního života, která nám bude pomáhat s různými úkoly, od těch všedních až po složité.

Zdroje článku:
theprint.in
ed.ac.uk

#