Google představuje Gemini AI ve verzi 2.5. Konkurenci drtí na všech frontách

Gemini 2.5 představuje milník na cestě k umělé inteligenci se schopností „uvažování“ podobného lidskému, a to díky schopnosti chápat rozsáhlé kontexty a interpretovat více forem dat.

Od září 2024, kdy OpenAI představila první model se schopností hlubokého uvažování, další společnosti, jako je Anthropic, DeepSeek, xAI a nyní i Google, urychlily své úsilí, aby nezůstaly pozadu. V závratném závodě o vedoucí postavení v oblasti umělé inteligence udělala společnost Google obrovský skok vpřed vydáním modelu Gemini 2.5, nové generace modelů umělé inteligence speciálně navržených tak, aby „uvažovaly“ před generováním odpovědi.

Tato funkce představuje klíčový rozdíl oproti předchozím modelům založeným pouze na statistických předpovědích. Uvažování v umělé inteligenci není jen o klasifikaci nebo předvídání: zahrnuje analýzu informací, zvažování kontextu, vytváření logických souvislostí a přijímání informovaných rozhodnutí.

Gemini 2.5 toho dosahuje kombinací pokroků v posilování učení, technik „řetězce myšlenek“ a výrazného zlepšení architektury základního modelu.

Multimodální výkon a obrovský kontext

Jedním z nejpozoruhodnějších aspektů této umělé inteligence je její schopnost zpracovat 1 milion tokenů, což odpovídá přibližně 750 000 slov, na jediném vstupu. Brzy bude tato hodnota rozšířena na 2 miliony tokenů, což AI umožní analyzovat celé knihy, rozsáhlé databáze nebo dokonce celá úložiště kódu najednou.

1/ Gemini 2.5 is here, and it’s our most intelligent AI model ever.

Our first 2.5 model, Gemini 2.5 Pro Experimental is a state-of-the-art thinking model, leading in a wide range of benchmarks – with impressive improvements in enhanced reasoning and coding and now #1 on… pic.twitter.com/mtEdRCTcgF
— Sundar Pichai (@sundarpichai) March 25, 2025

Její multimodální povaha jí umožňuje interpretovat a generovat text, zvuk, obrázky, video a kód, což ji činí ideální pro komplexní úlohy, jako je vytváření videoher z jediného podnětu nebo navrhování vizuálně přitažlivých webových aplikací.

Působivé technické úspěchy

Podle serveru LMArena se jedná o největší skok mezi dvěma generacemi stejného LLM.

V klíčových testech byl jeho výkon pozoruhodný:

Vedoucí postavení v platformě LMArena, která je založena na hodnocení lidských preferencí.
68,6 % v Aider Polyglot, metrice pro úpravu kódu, čímž porazil modely od OpenAI, Anthropic a DeepSeek.
63,8 % v testu SWE-Bench Verified, který měří schopnosti vývoje softwaru, čímž překonává modely OpenAI a DeepSeek, ale stále zaostává za modelem Claude 3.7 společnosti Anthropic (70,3 %).

Kromě toho v testu Humanity’s Last Exam, což je extrémně komplexní multimodální test zahrnující matematiku, přírodní vědy a humanitní vědy, dosáhl Gemini 2.5 skóre 18,8 %, čímž stanovil novou referenční hodnotu pro modely, které nepoužívají externí nástroje.

Gemini 2.5 v akci

Společnost Google dala tento model do rukou vývojářů a firem prostřednictvím platforem, jako jsou AI Studio a Vertex AI, aby mohli experimentovat a vyvíjet škálovatelná řešení. Cílem není jen vytvořit chytřejšího asistenta, ale vytvořit základ pro autonomní agenty, systémy schopné vykonávat úkoly bez přímého zásahu člověka.

První model této řady, Gemini 2.5 Pro Experimental, je v současnosti nejpokročilejším modelem společnosti Google a je již k dispozici vývojářům v aplikaci Google AI Studio a také předplatitelům prémiového plánu Gemini Advanced.

Jaký je další krok? Gemini 2.5 není konečným cílem, ale mezistupněm k ještě sofistikovanějším modelům. Společnost Google uvedla, že od nynějška budou všechny její umělé inteligence nativně integrovat schopnosti uvažování, což naznačuje, že se dočkáme stále schopnějších, kontextových a autonomních aplikací.

Výzvy a vyhlídky do budoucna

Navzdory svým působivým schopnostem čelí Gemini 2.5 značným výzvám. Jednou z hlavních je jeho výkonnost při programování úloh. Přestože překonává mnoho svých konkurentů, v testu SWE-Bench Verified stále nedosahuje výkonu modelu Claude 3.7 společnosti Anthropic. To naznačuje, že v oblasti porozumění a generování složitého kódu je co zlepšovat.

Rozhodujícím faktorem při překonávání těchto problémů by mohla být integrace nativních schopností uvažování do budoucích verzí umělé inteligence Google. Neustálým zlepšováním svých algoritmů a architektury má společnost Google potenciál stanovit nové standardy v odvětví umělé inteligence.

Závěrem lze říci, že verze Gemini 2.5 představuje významný pokrok v oblasti umělé inteligence, ale také zdůrazňuje důležitost pokračujících inovací pro odstranění současných omezení a plné využití potenciálu těchto nových technologií.