Úspěch společnosti DeepSeek spočívá ve zdánlivě nezkušené generaci Z

Společnost DeepSeek dosáhla úspěchu díky tomu, že se zaměřila na něco, co dělá jen málo západních společností: dala prostor mladým, místním, čerstvě vystudovaným, ale geniálním lidem.

Nedávné představení DeepSeek R1, umělé inteligence čínské výroby, způsobilo revoluci na světovém trhu. Deepseek poslal akcie společnosti Nvidia, jedné z předních firem v oblasti umělé inteligence, prudce dolů a mohli jsme vidět její neuvěřitelné schopnosti ve srovnání s ChatGPT Plus. Asijská umělá inteligence obrátila Wall Street vzhůru nohama během několika hodin.

Překvapivé je především to, kdo za touto neuvěřitelnou technologií stojí: tým velmi mladých lidí s malými pracovními zkušenostmi v jiných společnostech. Zatímco si šéfové stěžují, že generace Z nemá stejnou disciplínu, jakou vyžadují oni, tato revoluční technologie se rozhodla vsadit na generaci, která vyrostla v digitálním světě, a také na mileniály.

V této zprávě budeme analyzovat, kdo jsou některé z tváří, které stojí za společností DeepSeek: jejich věk, studium, kde pracovali (nebo dříve absolvovali stáž) atd. Tato revoluce navíc vyvolala debatu na sociálních sítích: mnoho nadnárodních společností v USA a Evropě odmítá čínské odborníky kvůli geopolitickým otázkám, čímž přichází vniveč spousta talentů.

Podíváme-li se na profily na síti LinkedIn, zjistíme, že za touto technologickou revolucí stojí mladí absolventi nejlepších čínských škol, jako je například Pekingská univerzita. V loňském rozhovoru generální ředitel Liang Wenfeng popsal, co u zaměstnanců hledá: „Naším kritériem výběru byla vždy vášeň a zvědavost,“ řekl. „Touha mnoha lidí po výzkumu daleko převyšuje jejich zájem o peníze.“ Společnost má údajně asi 300 zaměstnanců.

Důvěra v mladé talenty

Již před několika týdny tuto společnost analyzovala jedna z médií. Připomnělo, že hnací silou úspěchu společnosti DeepSeek je tým „mladých géniů“, jak vyplynulo z interních zdrojů a analýzy čínských médií. Zakladatel společnosti Liang Wenfeng, bývalý student umělé inteligence na Zhejiang University, vede skupinu talentovaných osob, které jsou čerstvými absolventy nebo právě začínají svou kariéru v oblasti umělé inteligence.

Tato netradiční náborová strategie upřednostňuje schopnosti před zkušenostmi, čímž se DeepSeek odlišuje od ostatních místních společností zabývajících se umělou inteligencí. Mezi významné členy společnosti DeepSeek patří Gao Huazuo, absolvent fyziky na Pekingské univerzitě, a Zeng Wangding, který studuje magisterský obor na Institutu umělé inteligence Pekingské univerzity pošt a telekomunikací.

V rozhovoru Wenfeng uvedl, že v jeho týmu nejsou žádní kouzelníci, ale většinou čerství absolventi nejlepších univerzit, doktorandi ve čtvrtém nebo pátém ročníku a někteří mladí lidé, kteří absolvovali teprve před několika lety. Navíc vysvětlil, že v týmu, který stojí za modelem V2, není nikdo, kdo by se do Číny vrátil ze zahraničí; všichni jsou místní. „Místo toho, aby člověk potřeboval doktorát a dlouholeté zkušenosti v oboru, aby byl skutečně užitečný,“ vidí velký potenciál v chytrých, po učení toužících dvacátnících a říká, že takových lidí je v Číně mnoho.

Jak zveřejňuje analýza této náborové strategie, v odvětví umělé inteligence je najímání zkušených veteránů normou a mnoho místních čínských startupů zabývajících se umělou inteligencí dává přednost seniorním výzkumníkům nebo těm s doktorátem ze zahraničí. Společnost DeepSeek však jde proti proudu a upřednostňuje mladé lidi bez pracovních zkušeností. Jeden z headhunterů, který se společností DeepSeek spolupracoval, prozradil, že DeepSeek nenajímá starší technické pracovníky: „Maximální délka praxe je 3-5 let“.

Liang Wenfeng v rozhovoru v roce 2023 také uvedl, že „většinu našich vedoucích technických pozic obsazujeme čerstvými absolventy nebo těmi, kteří mají jeden až dva roky pracovních zkušeností“. A analýza dodává, že jak si společnost DeepSeek bez pracovních zkušeností vybírá své kandidáty? A odpověď zní, že se dívá na potenciál.

„Když něco děláte dlouhodobě, nejsou zkušenosti tak důležité; ve srovnání s nimi jsou důležitější klíčové dovednosti, kreativita a nadšení“. Je přesvědčen, že možná 50 nejlepších talentů v oblasti umělé inteligence na světě není v současné době v Číně, ale můžou si tyto talenty vypěstovat sami.

Kdo je generálním ředitelem společnosti DeepSeek

Muž, který stojí za čínskou společností DeepSeek, je nenápadný podnikatel se zkušenostmi v oblasti financí, nikoliv umělé inteligence. Liang se narodil v roce 1985 a podle místních médií vyrůstal v jihočínské provincii Kuang-tung, kde jeho rodiče pracovali jako učitelé na základní škole.

Podle zpráv o něm projevoval od útlého věku talent v matematice. Čínská média uvedla, že studoval informační inženýrství na Zhejiang University v Hangzhou, technologickém centru na východě Číny, kde sídlí čínský gigant v oblasti elektronického obchodu Alibaba Group.

Liangova kariéra začala jeho působením v úplně jiném odvětví: ve finančnictví. V roce 2015 Liang založil kvantitativní hedgeový fond High-Flyer, který se při vývoji obchodních strategií opírá o matematiku a umělou inteligenci.

V roce 2017 již firma, která nyní obsluhuje více než 10 000 klientů, najala výzkumný tým AI a podle svých internetových stránek používá pro své obchodování téměř výhradně algoritmy AI. V roce 2023 založila společnost DeepSeek se sídlem v Chang-čou, která se věnuje vývoji velkých jazykových modelů.

Někteří z vedoucích pracovníků společnosti DeepSeek: hlavní řešitel.

Hlavním výzkumníkem (jak vysvětlují různá média) čínské společnosti DeepSeek AI je Luo Fuli. Počátkem roku 2022 vyšlo najev , že v rámci renomované konference na Pekingské univerzitě publikovala 8 výzkumných prací týkajících se algoritmů AI a hlubokého učení. V polovině roku 2022 přešla do společnosti DeepSeek jako vedoucí výzkumný pracovník a od té doby tam působí dodnes.

Je známo, že je jí 29 let a vede tým, který se věnuje vytváření vysoce výkonných jazykových modelů, které vyžadují méně výpočetních zdrojů. V čínských médiích je označována jako „Genius AI Gal“ a získala široké uznání za své průkopnické příspěvky ke zpracování přirozeného jazyka (NLP). To přitáhlo pozornost velkých společností, jako jsou Alibaba a Xiaomi.

Luo pracovala ve společnosti Alibaba jako výzkumná pracovnice v akademii DAMO, kde vedla vývoj vícejazyčného předtréninkového modelu VECO a pomáhala propagovat open source projekt AliceMind. Podle zveřejněných informací dostala lákavou nabídku v dolarech od společnosti Xiaomi, která jí nabídla 10 milionů dolarů (240 milionů korun), ale Luo učinila odvážné rozhodnutí opustit Alibabu v roce 2022 a připojit se k DeepSeek.

Od stáže v Nvidii k revoluci v umělé inteligenci

Společnost DeepSeek dosáhla úspěchu díky tomu, že se zaměřila na něco, co dělá jen málo západních společností: dává prostor šikovným mladým lidem. Na jedné straně je tu výzkumník Zizheng Pang, který využívá svůj profil na sociální síti X, aby dal najevo svou hrdost na to, že DeepSeek je nejstahovanější aplikací. Sám mladík uvádí, že dříve pracoval ve společnosti Nvidia a studoval na univerzitách v Adelaide a Monash (obě v Austrálii). Zhiding Yu, vedoucí výzkumný pracovník a doktorand, který ve společnosti Nvidia pracuje od roku 2018, se rozhodl podělit o své zkušenosti ze spolupráce s Pangem.

„Zizheng absolvoval stáž ve společnosti NVIDIA v létě roku 2023. Později, když jsme zvažovali, že mu učiníme nabídku práce na plný úvazek, se bez většího váhání rozhodl připojit k DeepSeek. V té době měl multimodální tým společnosti DeepSeek pouze 3 lidi. Zizhengovo tehdejší rozhodnutí na mě dodnes dělá velký dojem. Významně se podílel na několika důležitých pracích ve společnosti DeepSeek, včetně DeepSeek-VL2, DeepSeek-V3 a DeepSeek-R1.“

Mnoho našich nejlepších talentů pochází z Číny a tito talenti nemusí uspět pouze v americké společnosti. Naopak, my se od nich hodně učíme. Dodává, že se domnívá, že pokud budou společnosti jako Nvidia pokračovat ve „vymýšlení geopolitických agend a vytváření nepřátelských názorů vůči čínským výzkumníkům, střelíme se do nohy a ztratíme další konkurenceschopnost“.

Z univerzity na DeepSeek

Dalším příkladem je Runxin Xu, který pracuje jako výzkumník ve společnosti DeepSeek. Podílí se na vývoji modelových řad DeepSeek, včetně DeepSeek-R1, DeepSeek V1/V2/V3, DeepSeek Math, DeepSeek Coder a DeepSeek MoE.

Dříve byl studentem magisterského studia na Ústavu počítačové lingvistiky na Fakultě elektrotechniky, počítačové a informační vědy Pekingské univerzity a předtím získal bakalářský titul na Šanghajské univerzitě Jiao Tong.

Studium ukončil v červnu 2023 a od srpna 2023 pracuje ve společnosti DeepSeek AI. Absolvoval také postgraduální studium LLM. Metabit Trading, a to po dobu několika měsíců v letech 2022 až 2023. Od ledna do září 2022 pracoval na webech, jako je ByteDance Search, a nějaký čas strávil na vyhledávači v obchodním centru Douyin Mall.