Náklady na používání umělé inteligence stále klesají, rostoucímu výkonu navzdory

Náklady na používání umělé inteligence stále klesají, rostoucímu výkonu navzdory

Cena za používání nejvýkonnějších modelů AI se za velmi krátkou dobu výrazně snížila.


Prostředí umělé inteligence prochází bezprecedentní ekonomickou transformací. To, co bylo ještě před dvěma lety luxusem vyhrazeným velkým společnostem nebo projektům s velkými rozpočty, je nyní dostupné středně velkým společnostem a dokonce i nezávislým vývojářům. Tuto tichou revoluci ilustruje graf Ethana Mollicka, profesora na Pensylvánské univerzitě, v němž náklady na využití umělé inteligence v přepočtu na milion tokenů za poslední dva roky výrazně klesly.

Volný pád nákladů na využívání AI

Mollickovy údaje jsou objevné: náklady na používání vysoce výkonných modelů AI klesly za pouhé dva roky o ohromujících 82 %. Tento údaj, který by se v jiném technologickém odvětví mohl zdát přehnaný, odráží, jak rychle došlo k demokratizaci AI, kdy jsou poplatky za použití pro firmy a nezávislé vývojáře mnohem nižší.

https://twitter.com/emollick/status/1908220677502755328

Související článek

Oblíbená kancelářská svorka byla prvním prototypem AI agenta. Používat ji můžete i dnes
Oblíbená kancelářská svorka byla prvním prototypem AI agenta. Používat ji můžete i dnes

Clippy vám nyní může být skvělým pomocníkem jako asistent na pozadí počítače.

Jak zdůrazňuje vývojář společnosti Stagehand Anirudh Kamath, ještě před dvěma lety by zpracování 1,5 miliardy tokenů stálo asi 70 000 dolarů (v přepočtu zhruba 1,5 milionů korun) pomocí GPT-4. Dnes Gemini v roce 2025 nabízí srovnatelný výkon za pouhých 150 dolarů (cca 3 300 korun). Toto snížení nákladů o 99,7 % u modelů s podobným výkonem jako GPT-4 svým způsobem redefinuje, kdo si může dovolit používat pokročilé modely umělé inteligence ve stále více projektech.

Společnost DeepSeek se dostala na titulní stránky novin díky svým pokrokům v oblasti umělé inteligence a svému výkonu za cenu. Podle Daria Amodeie, generálního ředitele společnosti Anthropic, DeepSeek pracuje s přibližně 50 000 čipy generace Hopper, což je podle Amodeie podobná kapacita jako u velkých amerických technologických společností. Podle jeho analýzy pokrok společnosti DeepSeek odráží přirozené snižování nákladů v odvětví, které se odhaduje na 75 % ročně.

Přesto Mollickův graf ukazuje, že se jedná o zobecněný jev. Modely, jako je nedávný Gemini 2.5, s vysokým výkonem podle testu GPQA (General Purpose Question Answering), jsou výrazně levnější ve srovnání s tím, kolik původně stál GPT-4 na milion tokenů.

Totéž platí pro náklady na Gemini 1.5 Flash oproti původnímu GPT-4 z roku 2023, neboť podle údajů se náklady snížily o 99,7 %. Připomeňme, že GPT-4 vyšel s náklady 60 USD (cca 1 300 korun) na milion tokenů z brány.

https://twitter.com/kamathematic/status/1908298648003502335?v=2

Mollick ve své analýze naznačuje, že pravděpodobně nemá cenu sázet na to, že tento trend brzy skončí. Závod o výkonnější a levnější modely nevykazuje žádné známky zpomalení, přičemž společnosti jako Claude, OpenAI a Google v tomto novém souboji nákladů a výkonu tvrdě soupeří o pozici.

Nové možnosti pro malé a střední podniky

To představuje pro mnoho společností nebývalou příležitost. Startupy, které si dříve nemohly dovolit integrovat pokročilé modely do svých produktů, tak nyní mohou učinit s rozumnými investicemi. Totéž platí pro středně velké společnosti, které nyní mohou zkoumat případy použití, jež byly dříve mimo jejich rozpočtový dosah.

Skutečná revoluce spočívá v nových případech použití, které se mohou objevit díky této větší dostupnosti. Aplikace, které byly dříve ekonomicky nerealizovatelné, lze nyní vyvíjet se skromnými rozpočty, což může vyvolat novou vlnu inovací v odvětvích, jako je vzdělávání, zdravotnictví, elektronický obchod nebo profesionální služby.

Kromě toho jsou klesající náklady na umělou inteligenci dány také pokrokem v energetické účinnosti čipů a hardwaru, které se používají k trénování těchto modelů. Společnosti vyvíjejí účinnější technologie, které umožňují hospodárnější využívání zdrojů, což přispívá k celkovému snížení nákladů. Podle zprávy Stanfordovy univerzity jsou klíčovými faktory tohoto trendu vývoj specializovaného hardwaru a optimalizace algoritmů.

Zdroje článku:
Autorský text

#