Torrenty jsou stále v kurzu. Nyní se používají k distribuci umělé inteligence

Torrenty jsou stále v kurzu. Nyní se používají k distribuci umělé inteligence

Mnoho lidí si pojem „torrent“ stále spojuje s webovými stránkami pro neautorizované stahování filmů a dalšího obsahu chráněného autorskými právy. Téměř od prvního okamžiku existence protokolu BitTorrent jej však využívají projekty vývoje softwaru k šíření „nejtěžšího“ softwaru.


Například mnoho linuxových distribucí (především Ubuntu, Fedora, Debian, Arch a OpenSUSE) používá torrenty jako metodu distribuce při každém vydání nové verze. Je to proto, že stahování pomocí torrentů umožňuje efektivní a škálovatelnou distribuci velkých souborů.

Decentralizovaná architektura totiž zabraňuje přetížení oficiálních webových a/nebo FTP serverů v době největší poptávky po souborech (obvykle těsně po každém vydání).

Související článek

Společnost Microsoft uvádí verzi Office 365 zdarma ke stažení
Společnost Microsoft uvádí verzi Office 365 zdarma ke stažení

Když se řekne kancelářský balík, všichni si představíme sadu Office s aplikacemi Word, Excel nebo PowerPoint. Problémem je, že mnoho lidí se kvůli ceně předplatného balíku Microsoft obrací na alternativy, jako jsou Dokumenty Google. To se však nyní může změnit, protože se objevila bezplatná verze sady Office.

Není přesně jasné, které linuxové distribuce přijaly protokol BitTorrent jako první, ale víme, že po jeho vytvoření Bramem Cohenem v roce 2002 jej brzy přijalo několik linuxových projektů. V té době jim to ušetřilo tisíce dolarů za šířku pásma, což bylo pro menší komunitní projekty záchranou.

Tento systém se stal tak rozšířeným, že již v roce 2005 začal web Linuxtracker tyto linuxové distribuce pomocí torrentů agregovat a od té doby se tento web neustále rozrůstal a stal se jedním z hlavních zdrojů linuxových distribucí.

Prostřednictvím BitTorrentu jsou často k dispozici také multimediální materiály, například filmy z veřejných domén nebo filmy nezávislých umělců.

Od distribucí k modelům

Kromě linuxových distribucí a občasných obzvlášť „těžkých“ open source aplikací má BitTorrent i další funkce.

Už více než rok se masivně používá ke stahování jednoho z nejobjemnějších a nejpopulárnějších typů softwaru současnosti: velkých generativních modelů umělé inteligence, a to jak obrazových, tak textových.

Nesčetné množství odvozených a optimalizovaných verzí založených na open source modelech, jako je Stable Diffusion a vícenásobné LLM, tak počítá s BitTorrentem jako s nenahraditelným zdrojem, a to vzhledem k velikosti několika desítek GB, které mohou nejvýkonnější verze těchto modelů dosáhnout.

Před necelým rokem francouzský open source startup Mistral AI spustil nový LLM bez tiskové zprávy nebo velkolepého oznámení: jednoduše zveřejnil odkaz na síti X, což byla strategie, která ostře kontrastovala s téměř souběžným spuštěním, a to Gemini společnosti Google.

Protože tam, kde vyhledávací společnost přes všechen hluk kolem uvedení na trh umožnila pouze letmý pohled na kapacity svého nového modelu, Mistral AI předložila ke stažení ne méně než 87 GB, což odpovídá jejímu modelu Mixtral 8x7B.

O několik měsíců později uvedl na trh další model, Mixtral 8x22B, tentokrát s kapacitou 281 GB. A v září 2024 se na seznam verzí vydávaných prostřednictvím torrentů připojil její první multimodální AI, Pixtral 12B.

V důsledku těchto vydání již existuje nespočet derivátů modelu Mixtral, které umožňují například generování zcela necenzurovaného textu.

A před několika dny se na trhu torrentů objevil také DeepSeeku.

První projekty

V posledních dvanácti měsících se objevilo několik výjimečných projektů, které mají potenciál stát se v oblasti umělé inteligence tím, čím byl LinuxTracker v oblasti open source operačních systémů:

  • AiTracker.art byl projekt, který byl aktivní po většinu roku 2024 (nyní web při přístupu hlásí chybu). Jednalo se o decentralizovanou platformu založenou na torrentech, která vznikla jako alternativa k šíření modelů AI prostřednictvím centralizovaných služeb, jako jsou Huggingface a Civitai.
  • LlamaTor je komunitní projekt, který nabízí decentralizovaný způsob distribuce a stahování modelů umělé inteligence. Nabízí skripty v jazyce Python, které usnadňují vytváření i stahování torrentů obsahujících takové modely. Je k dispozici na serveru GitHub.

#