Google DeepMind nedávno představil svůj nejpokročilejší model se systémem, který před odpovědí vnitřně uvažuje a vede hlavní žebříčky v oboru. Tento vývoj znamená zásadní změnu ve zpracování informací.
Společnost Google DeepMind představila model Gemini 2.5, který považuje za svůj dosud nejvýkonnější model umělé inteligence se systémem, který interně analyzuje informace předtím, než odpoví a vede hlavní žebříčky v oboru. Tento posun znamená významnou změnu ve zpracování dat systémy umělé inteligence.
Podle vlastního oznámení na oficiálním blogu společnosti představuje Gemini 2.5 díky nové architektuře kvalitativní skok ve vývoji jazykových modelů. Tato technologie nepředpovídá pouze slova, ale zkoumá informace, vyvozuje závěry a posuzuje kontext, než poskytne odpověď. Tento přístup je krokem vpřed oproti předchozím modelům, které se spoléhaly především na předpovídání slovních sekvencí bez hlubší analýzy kontextu.
Model, který myslíjako nikdy předtím
To, co model Gemini 2.5 odlišuje, je jeho schopnost zpracovávat data způsobem, který se podobá lidskému uvažování. Tato funkce vylepšuje to, co bylo implementováno již v bezplatné verzi Gemini, ale s mnohem robustnějšími výsledky. Na rozdíl od svých předchůdců Gemini 2.5 nejen zpracovává informace, ale dokáže také identifikovat složité vzorce a korelace, které mohou zůstat jinými modely umělé inteligence nepovšimnuty.
1/ Gemini 2.5 is here, and it’s our most intelligent AI model ever.
— Sundar Pichai (@sundarpichai) March 25, 2025
Our first 2.5 model, Gemini 2.5 Pro Experimental is a state-of-the-art thinking model, leading in a wide range of benchmarks – with impressive improvements in enhanced reasoning and coding and now #1 on… pic.twitter.com/mtEdRCTcgF
Technické testy tento pokrok potvrzují: experimentální verze Gemini 2.5 Pro dominuje seznamu LMArena, který hodnotí preference skutečných uživatelů a zejména září v testech matematického a vědeckého uvažování. Model dosáhl pozoruhodného skóre 18,8 % v testu Humanity’s Last Exam, který vytvořily stovky odborníků a který měří pokročilé lidské znalosti. Takové testy jsou klíčové pro posouzení schopnosti umělé inteligence porozumět a řešit složité problémy, které vyžadují vysokou úroveň porozumění a analýzy.
Pokud jde o programování, což je další silná stránka této aktualizace, Gemini 2.5 dosáhl 63,8 % v testu SWE-Bench Verified, čímž se staví do pozice klíčového nástroje pro programátory. Tento výkon nechává za sebou nové funkce, se kterými přišel Samsung Galaxy S25 na začátku tohoto roku. Schopnost Gemini 2.5 efektivně chápat a generovat kód z něj dělá nepostradatelného spojence pro vývojáře, kteří chtějí optimalizovat svůj pracovní postup a omezit chyby v kódu.
Rozšíření kontextového okna na 1 milion tokenů (brzy to budou 2 miliony) umožňuje modelu zpracovat obrovské množství informací. Jeho multimodální schopnost usnadňuje současnou práci s textem, zvukem, obrázky a videem, což otevírá dveře tvůrcům, kteří se dříve spoléhali na Gems pro specifické úkoly. Tato multimodální schopnost je obzvláště užitečná v aplikacích, které vyžadují integraci různých typů dat, jako je analýza sociálních médií nebo tvorba multimediálního obsahu.
Gemini 2.5 vyniká při vytváření dobře navržených webových stránek, vývoji aplikací založených na agentech, úpravě kódu a navrhování kompletních her ze základních instrukcí. Nyní je k dispozici v aplikaci Google AI Studio pro vývojáře a v aplikaci Gemini pro předplatitele Gemini Advanced. Tato dostupnost na vývojářských platformách umožňuje uživatelům experimentovat s modelem a přizpůsobit jej svým specifickým potřebám, což by mohlo podpořit inovace v různých odvětvích.
Společnost z Mountain View připravuje cenový systém, který umožní vývojářům používat Gemini 2.5 Pro bez tolika omezení pro rozsáhlé projekty. Tento model by mohl změnit způsob interakce se systémy umělé inteligence a nabídnout přesnější a užitečnější reakce ve složitých aplikacích, které potřebují lépe porozumět kontextu. Díky těmto vylepšením se společnost Google DeepMind staví do čela umělé inteligence a vyzývá své konkurenty k inovacím a zdokonalování vlastních technologií.