Qwen je model umělé inteligence čínského giganta Alibaba, který nedávno dosáhl verze 2.5 Max. Dle testů je schopen překonat DeepSeek ve většině z nich.
Společnosti DeepSeek se v posledních dnech podařilo způsobit revoluci v odvětví umělé inteligence a zpřístupnit všem jazykový model, který je schopen konkurovat modelům amerických společností, jako jsou Google a OpenAI, a dokonce je výkonem a efektivitou překonat. Několik dní po uvedení na trh je její aplikace již nejstahovanější na hlavních mobilních platformách a některé z nejvýznamnějších osobností v oboru, jako například Sam Altman a Satya Nadella, ocenily milník, kterého tato neznámá společnost čínského původu dosáhla.
Válka o vytvoření nejvýkonnějšího a nejefektivnějšího modelu umělé inteligence teprve začíná a vše nasvědčuje tomu, že Silicon Valley již není epicentrem tohoto rostoucího odvětví, protože jen několik dní po průlomu společnosti DeepSeek čínský gigant Alibaba předvedl, jak je jeho nový jazykový model Qwen 2.5 Max schopen překonat DeepSeek v naprosté většině testů.
Qwen 2.5 Max překonává v benchmarcích Llama a DeepSeek V3
Prostřednictvím příspěvku na oficiálním blogu Qwen odhalila společnost Alibaba pokrok, kterého dosáhla s nejnovější verzí svého jazykového modelu. Při porovnání Qwen 2.5 Max s nejnovějšími modely Llama a DeepSeek byly výsledky dosažené modelem AliBaba v mnoha případech lepší.
Qwen 2.5 Max používá podobnou architekturu jako DeepSeek, známou jako Mixture of Experts neboli MoE, která umožňuje, aby modely byly mnohem efektivnější a škálovatelnější. Díky této architektuře je namísto jednoho monolitického modelu se všemi znalostmi rozdělen do několika „expertů“, z nichž každý se specializuje na podmnožinu dat nebo úloh. Další prvek, „směrovač“, rozhoduje o tom, který z těchto expertů je nejvhodnější pro zpracování konkrétního vstupu.
Použití této techniky spolu s pokroky v tréninku s více než 20 miliardami tokenů a metodikami Supervised Fine Tuning (SFT) a Referencing Learning from Human Feedback (RLHF) umožnilo společnosti Alibaba vytvořit jeden z nejpokročilejších modelů, které jsou dnes k dispozici. Testování ukázalo, že Qwen2.5-Max překonává DeepSeek V3 ve srovnávacích testech, jako jsou Arena-Hard, LiveBench, LiveCodeBench a GPQA-Diamond, a zároveň dosahuje vysoce konkurenceschopných výsledků v jiných typech testů, včetně MMLU-Pro.
Qwen 2.5 Max lze nyní používat jak prostřednictvím platforem, jako je HuggingFace, tak i prostřednictvím vlastního oficiálního chatbotu Qwen, který umožňuje vybrat požadovaný model prostřednictvím rozbalovací nabídky v levém horním rohu.