Reddit vypíná kohoutek a masivně blokuje roboty, kteří kradou data pro trénování modelů umělé inteligence

Reddit vypíná kohoutek a masivně blokuje roboty, kteří kradou data pro trénování modelů umělé inteligence

Redditu se podařilo zablokovat společnosti, které nebyly ochotné dodržovat dohody o použitelnosti, aby používaly obsah platformy k trénování modelů umělé inteligence.

Možná si vzpomenete, když před časem Reddit oznámil, že se pouští do podnikání v oblasti umělé inteligence. Učinil tak nejprve prostřednictvím partnerství se společností Google a také partnerstvím s OpenAI. Jde o to, že Redditu se podařilo vytvořit systém, který na základě dohod umožnil hlavním konkurentům v oblasti generativních modelů AI využívat jeho databázi.

Zbytek světa to však zřejmě chápal jinak a musel si myslet, že fóra hostovaná na této platformě jsou volnou laťkou. Jak uvádí Ars Technica, zdaleka tomu tak není. Reddit blokuje boty společností, s nimiž nemá uzavřenou dohodu, a důvody jsou poměrně jednoduché.

Spoiler: Motivace není ekonomická

Před rokem začal Reddit tyto změny zavádět, aby zablokoval roboty, kteří fóra umístěná na jeho platformě využívali jako otevřený datový bar k trénování modelů umělé inteligence (nebo jinými slovy, aby na účet Redditu vydělávali peníze bez uvedení autora).

Nakonec tyto snahy skončily tím, že se Reddit rozhodl zpoplatnit přístup k API. Ukázalo se však, že tento poplatek za přístup je tak vysoký, že mnoho aplikací třetích stran, které sloužily k přístupu na Reddit z různých platforem, nakonec skončilo.

Na druhou stranu tyto změny způsobily, že téměř žádný jiný vyhledávač než Google nebo SearchGPT vyvinutý společností OpenAI nezobrazuje výsledky vyhledávání obsahu umístěného na fórech Redditu. S těmito změnami souhlasí i samotný generální ředitel společnosti Steve Huffman:

‚Bez těchto dohod nemáme žádné slovo ani povědomí o tom, jak se naše data zobrazují a k čemu se používají, což nás dostalo do situace, kdy blokujeme společnosti, které nechtěly přistoupit na myšlenku, jak chceme, aby se naše data používala.

Společnosti jako Anthropic a Perplexity nebyly ochotny se společností Reddit vyjednávat. Neudělala to ani společnost Microsoft, která tvrdí, že chování Redditu jednoznačně zvýhodňuje Google a SearchGPT a zároveň vážně poškozuje Bling. Vypadá to, že nás čeká dlouhá telenovela.