Vzestup ChatGPT způsobil, že se společnosti i uživatelé začali více zajímat o umělou inteligenci i její možnosti. V důsledku toho některé země schválily mnohamilionové plány na využití výhod této technologie, zatímco firmy, jako je Apple, pokračují ve zdokonalování svého receptu na úspěch. A bohužel pro Spojené státy je Čína na pokraji dosažení toho, čeho se nejvíce obávaly: modelu umělé inteligence schopného konkurovat ChatGPT.
Čínská AI laboratoř DeepSeek uvedla na trh svou rodinu modelů R1 pod otevřenou licencí MIT. Největší model tak má 671 miliard parametrů a má konkurovat modelu o1 společnosti OpenAI, ale vydali také menší verze nazvané DeepSeek-R1-Distill s velikostí od 1,5 miliardy do 70 miliard parametrů. Ve skutečnosti je překvapivé nejen to, že menší verze může běžet na notebooku, ale i to, že jejich model překonává o1 od OpenAI jak v testech matematického uvažování, tak v kódování.
Otevřené licencování a cenzura cloudu
Podle původní zprávy používá model R1 v době inference přístup simulovaného uvažování, který napodobuje lidský myšlenkový proces při řešení složitých problémů. Vzhledem k tomu, že modely jsou pod licencí MIT, lze je studovat, upravovat a komerčně využívat, a proto představují významný pokrok v dostupnosti vysokokapacitních modelů. Kromě toho každá odpověď těchto modelů začíná pseudo-XML štítkem, který podrobně popisuje řetězec úvah použitých modelem k vytvoření odpovědi.
Pokud je však spuštěn ve své verzi hostované v cloudu z Číny, podléhá čínským internetovým předpisům, což omezuje odpovědi týkající se například autonomie Tchaj-wanu. Tuto cenzuru však lze obejít spuštěním mimo asijský region. DeepSeek se tak připojuje k Alibabě a Moonshot AI, dvěma dalším čínským laboratořím, které tvrdí, že jejich modely již napodobují schopnosti OpenAI o1. Dostupnost těchto menších a výkonnějších modelů navíc zajišťuje, že mohou běžet na místním hardwaru, čímž se vzdalují centralizovanému řízení.