DeepSeek se v současnosti nachází na vrcholu výkonnosti umělé inteligence díky vybroušenějšímu a důkladnějšímu vývoji než jeho konkurenti.
Donald Trump, nově jmenovaný prezident Spojených států, představil svůj ambiciózní plán na ovládnutí budoucnosti umělé inteligence. Projekt Hvězdná brána v hodnotě 500 miliard dolarů (12 bilionů korun) je neuvěřitelně ambiciózní nabídkou na ovládnutí trhu. Nyní se však zdá, že UI z Číny zpochybnila politický přístup, o němž se předpokládá, že by mohl ztroskotat ještě dříve, než se vůbec rozběhne. Podle časopisu Wired tato UI zvládne vše se stejným výkonem jako o1 od OpenAI, ale za zlomek ceny.
Co je DeepSeek
Deep Seek je open source čínská umělá inteligence neboli jazykový model, který se nedávno dostal do centra pozornosti pro svou neuvěřitelnou schopnost vyrovnat se OpenAI a jeho výkonnějšímu modelu o1, ale za nepatrný zlomek nákladů.
S nápadem přišel čínský hedgeový fond a v jeho čele stojí Liang Wenfeng, jeho zakladatel, který zaměřil zdroje na vývoj umělé obecné AI s ohledem na kvalitu, nikoliv na rychlost uvedení na trh. To je velmi zajímavé, protože dal přednost pomalejšímu postupu v závodě o dosažení tzv. umělé obecné inteligence (AGI), ale aby byla pro uživatele mnohem spolehlivější a s větším podílem spolupráce.
Jednou z jejích silných stránek je totiž to, že je ve všech svých modelech částečně otevřená, což umožňuje pochopit, jak funguje a jaké jsou body, které by ji mohly pomoci vylepšit.
Nedostatek prostředků zostřuje vynalézavost
Až dosud bylo cílem většiny UI vše zvětšit, aby měly větší výkon a mohly vše analyzovat mnohem efektivněji. USA však vetovaly Číně hardware potřebný k tomu, aby se jejich UI dostala na novou úroveň, nebo to tak alespoň bylo zamýšleno. Skutečně se jim podařilo AI zefektivnit.
Od roku 2022 nemá Čína přístup k vyspělým čipům s americkou proprietární technologií, což je donutilo optimalizovat své tréninkové metody, aby ji posunula na novou úroveň.
Vývojový tým plný mladých talentů, kteří čerstvě vystudovali technické univerzity v Pekingu nebo Tsinghua, dokázal to, co se zpočátku zdálo nemožné, porazit Spojené státy s otevřeným zdrojovým kódem a schopností jeho efektivnějšího využití. Faktem je, že by to stálo jen 5 % celkové ceny řešení AI, které nabízí OpenAI.
Až dosud čínská umělá inteligence zaostávala za potenciálem Spojených států, ale zdá se, že se to s uvedením verze R1 DeepSeek změnilo. K tomu použili systémy s přizpůsobenými komunikačními schématy mezi čipy, aby modely byly mnohem méně náročné na zdroje. Klíčovými technologiemi k tomu byly technologie MLA (Multi-head Latent Attention) a Mixture-of-Experts.
Ačkoli se to může zdát triviální, DeepSeek je převrat, který ukazuje, že umělá inteligence toho dokáže hodně i bez bezbřehého hrubého výkonu, který byl v závodě o nejvýkonnější model prodáván jako nevyhnutelný.