DeepSeek má nového konkurenta: Další revoluční AI je opět z Číny

Qwen je model umělé inteligence čínského giganta Alibaba, který nedávno dosáhl verze 2.5 Max. Dle testů je schopen překonat DeepSeek ve většině z nich.

Společnosti DeepSeek se v posledních dnech podařilo způsobit revoluci v odvětví umělé inteligence a zpřístupnit všem jazykový model, který je schopen konkurovat modelům amerických společností, jako jsou Google a OpenAI, a dokonce je výkonem a efektivitou překonat. Několik dní po uvedení na trh je její aplikace již nejstahovanější na hlavních mobilních platformách a některé z nejvýznamnějších osobností v oboru, jako například Sam Altman a Satya Nadella, ocenily milník, kterého tato neznámá společnost čínského původu dosáhla.

Válka o vytvoření nejvýkonnějšího a nejefektivnějšího modelu umělé inteligence teprve začíná a vše nasvědčuje tomu, že Silicon Valley již není epicentrem tohoto rostoucího odvětví, protože jen několik dní po průlomu společnosti DeepSeek čínský gigant Alibaba předvedl, jak je jeho nový jazykový model Qwen 2.5 Max schopen překonat DeepSeek v naprosté většině testů.

Qwen 2.5 Max překonává v benchmarcích Llama a DeepSeek V3

Prostřednictvím příspěvku na oficiálním blogu Qwen odhalila společnost Alibaba pokrok, kterého dosáhla s nejnovější verzí svého jazykového modelu. Při porovnání Qwen 2.5 Max s nejnovějšími modely Llama a DeepSeek byly výsledky dosažené modelem AliBaba v mnoha případech lepší.

Qwen 2.5 Max používá podobnou architekturu jako DeepSeek, známou jako Mixture of Experts neboli MoE, která umožňuje, aby modely byly mnohem efektivnější a škálovatelnější. Díky této architektuře je namísto jednoho monolitického modelu se všemi znalostmi rozdělen do několika „expertů“, z nichž každý se specializuje na podmnožinu dat nebo úloh. Další prvek, „směrovač“, rozhoduje o tom, který z těchto expertů je nejvhodnější pro zpracování konkrétního vstupu.

Použití této techniky spolu s pokroky v tréninku s více než 20 miliardami tokenů a metodikami Supervised Fine Tuning (SFT) a Referencing Learning from Human Feedback (RLHF) umožnilo společnosti Alibaba vytvořit jeden z nejpokročilejších modelů, které jsou dnes k dispozici. Testování ukázalo, že Qwen2.5-Max překonává DeepSeek V3 ve srovnávacích testech, jako jsou Arena-Hard, LiveBench, LiveCodeBench a GPQA-Diamond, a zároveň dosahuje vysoce konkurenceschopných výsledků v jiných typech testů, včetně MMLU-Pro.

Qwen 2.5 Max lze nyní používat jak prostřednictvím platforem, jako je HuggingFace, tak i prostřednictvím vlastního oficiálního chatbotu Qwen, který umožňuje vybrat požadovaný model prostřednictvím rozbalovací nabídky v levém horním rohu.

DeepSeek má nového konkurenta: Další revoluční AI je opět z Číny

Qwen 2.5 Max překonává v benchmarcích Llama a DeepSeek V3

Umělá inteligence revolucionalizuje boj proti rakovině

Apple odkládá hlavní funkce umělé inteligence v iOS 19

Microsoft vybavil svého Copilota novými funkcemi. Ve srovnání s konkurencí však inovace nepřichází

LinkedIn zavádí na platformu funkce generativní AI, které uživat...

Afrika je hybnou silou západní umělé inteligence

Evropská stíhačka budoucnosti mění pozici kontinentu v moderních...

Dodávky hodinek Apple Watch zaznamenaly koncem minulého roku výz...

O co všechno přicházíte, když posloucháte hudbu z reproduktorů i...

LinkedIn zavádí na platformu funkce generativní AI, které uživatelům pomohou s hledáním práce

Afrika je hybnou silou západní umělé inteligence

Evropská stíhačka budoucnosti mění pozici kontinentu v moderních konfliktech

Dodávky hodinek Apple Watch zaznamenaly koncem minulého roku významný propad

LinkedIn zavádí na platformu funkce generativní AI, které uživatelům pomohou s hledáním práce

Google I/O 2024: Nejdůležitější událost roku společnosti Google má nyní své datum

Nový ASUS ZenFone 11 Ultra: Snapdragon 8 Gen 3 a 144Hz displej, který může konkurovat těm nejlepším

Odlišnost prodává: nového telefonu Nothing Phone (2a) se již dodalo více než 100 000 kusů.

Dokumenty

DeepSeek má nového konkurenta: Další revoluční AI je opět z Číny

Qwen 2.5 Max překonává v benchmarcích Llama a DeepSeek V3

Související článek

LinkedIn zavádí na platformu funkce generativní AI, které uživatelům pomohou s hledáním práce

Dokumenty