Proč AI agenti utrácejí víc, než by měli
Představa autonomního AI agenta, který neúnavně řeší úkoly 24 hodin denně, zní lákavě. Realita v podnicích je ale často jiná. Agenti postavení na velkých jazykových modelech (LLM) mohou snadno sklouznout do rekurzivních smyček, opakovaně dotazovat interní systémy nebo rozšiřovat původní úkol na oblasti, které s ním nesouvisí. Každý takový krok generuje nové volání modelu, a každé volání stojí tokeny.
Tokeny jsou základní jednotkou zpracování textu v LLM. Čím složitější dotaz a čím delší odpověď, tím víc tokenů se spotřebuje. Když agent pracuje v nekonečné smyčce nebo se rozhodne „optimalizovat“ proces, který mu nikdo nezadal, náklady rostou exponenciálně. Podle SiliconANGLE tomuto jevu čelí stále více firem, které přecházejí z experimentálního nasazení generativní AI do plnohodnotných produkčních workflow.
Problém není akademický. Představte si zákaznického agenta, který místo jednoduché odpovědi na dotaz začne procházet celou databázi transakcí, analyzovat trendy a generovat reporty, které si nikdo nevyžádal. Za pár hodin může spálit rozpočet, který měl vydržet celý měsíc.
Co přesně Agentic Token Controls umí
Portal26 svůj nový modul staví jako první specializovaný nástroj pro řízení tokenové spotřeby autonomních agentů v podnikovém měřítku. Jádrem řešení je možnost nastavit pevné rozpočty na úrovni jednotlivých agentů, konkrétních workflow nebo celé organizace.
Jakmile se agent přiblíží nastavenému limitu, systém začne jeho aktivitu automaticky zpomalovat. Pokud limit překročí, může být pozastaven nebo úplně ukončen. To dává IT týmům čas zasáhnout dřív, než dorazí nepříjemná faktura.
Kromě samotného omezování modul nabízí real-time viditelnost do toho, kde a jak se tokeny utrácejí. Administrátoři vidí, který agent žere nejvíc zdrojů, jaké workflow jsou nejnákladnější a kde se tvoří úzká hrdla. Systém navíc obsahuje adaptivní záruky, které reagují automaticky, aniž by musel někdo neustále hlídat dashboard.
Podle Artiho Ramana, generálního ředitele Portal26, je klíčové, aby firmy mohly agentickou AI škálovat „bez toho, aby se probudily k faktuře, na kterou nebyly připraveny“. Jako příklad uvádí Uber, kde rychlost adopce AI a předvídatelnost nákladů momentálně narážejí na limity.
Kdo za tím stojí a proč to řeší právě teď
Portal26 je americký startup zaměřený na bezpečnost a governance generativní AI. Založen byl s cílem pomoci firmám zavádět AI nástroje bez zbytečných rizik — ať už jde o únik dat, neetické použití modelů, nebo právě nekontrolované náklady.
Společnost získala celkem 15 milionů dolarů ve dvou investičních kolech, z toho 9 milionů v listopadu 2025. Mezi investory patří fondy Refinery, Shasta Ventures a Fusion Fund. Nový modul Agentic Token Controls navazuje na širší sadu Agentic Management nástrojů, které Portal26 nedávno uvedl a které se zaměřují na bezpečnost AI a měření skutečné obchodní hodnoty agentů.
Podle Pakshiho Rajana, chief product a AI officera ve firmě, jde o „více než jen kontrolu nákladů“ — modul má být základní vrstvou pro odpovědné provozování AI. To odráží širší trend v odvětví: firmy už nechtějí jen rychle nasazovat AI, ale chtějí ji provozovat udržitelně a predikovatelně.
Jaké to má dopady pro firmy v Česku a Evropě
Pro české a evropské firmy je téma řízení nákladů na AI aktuální stejně jako v Americe. Podniky v regionu často začínají s menšími experimenty, ale jakmile agenti vstoupí do produkce — ať už v zákaznické podpoře, analytice nebo automatizaci administrativy — mohou se náklady na volání cloudových modelů velmi rychle nafouknout.
Portal26 aktuálně nenabízí lokalizaci do češtiny a své služby směřuje primárně na anglicky mluvící podnikový trh v USA a západní Evropě. Pro české firmy to znamená, že pokud o nástroj budou mít zájem, musí počítat s provozem v angličtině. Konkrétní ceník nebyl uveden, ale s ohledem na zaměření na velké podniky a venture kapitálové financování lze očekávat enterprise SaaS model s ročním předplatným od několika tisíc dolarů výše.
Evropský kontext navíc přidává další vrstvu: EU AI Act požaduje, aby firmy používající AI v kritických oblastech měly jasné mechanismy oversightu a kontroly. Nástroje jako Agentic Token Controls mohou sloužit jako součást compliance strategie — nejen kvůli penězům, ale i kvůli prokázání, že organizace má nad svými agenty skutečnou kontrolu.
Není to jen o penězích, ale o důvěře
Největší překážkou při adopci agentické AI v podnicích není technologie sama, ale nedůvěra v její predikovatelnost. Finanční ředitelé neradi schvalují projekty, u kterých neumí odhadnout měsíční náklady. IT týmy zase neradi nasazují systémy, které se mohou vymknout kontrole.
Portal26 svým novým modulem cílí přesně na tuto bariéru. Když firma ví, že tokenové rozpočty jsou vymahatelné a že agenty lze v případě nouze zastavit, je ochotnější experimentovat a škálovat. A to je klíčové: bez důvěry v kontrolu se agentická AI nikdy nestane běžnou součástí podnikové infrastruktury.
Zda se Portal26 stane standardem v této kategorii, ukáže příští měsíce. Konkurence rozhodně nespí — jak cloudoví giganti, tak specializované governance platformy pracují na vlastních řešeních. Prozatím ale vypadá, že firma otevřela důležitou kategorii nástrojů, které budou brzy nezbytné pro každého, kdo chce s AI agenty pracovat zodpovědně.
Může si Agentic Token Controls nastavit i malá firma, nebo je to jen pro velké podniky?
Portal26 se primárně zaměřuje na enterprise segment, ale princip tokenových limitů by měly zavádět i menší firmy. Dnes existují jednodušší alternativy, jako je nastavení limitů přímo v API voláních u poskytovatelů jako OpenAI nebo Anthropic.
Jaký je rozdíl mezi tokenovým limitem a běžným měsíčním rozpočtem na AI?
Měsíční rozpočet je obvykle statický limit pro celý tým. Tokenový limit jde hlouběji — sleduje spotřebu v reálném čase na úrovni jednotlivých agentů a workflow a dokáže okamžitě zasáhnout, když se něco vymkne kontrole.
Nabízí některý český poskytovatel podobnou službu pro kontrolu AI nákladů?
V Česku zatím neexistuje přímý ekvivalent Portal26. Lokální firmy obvykle řeší kontrolu nákladů manuálně nebo pomocí nativních nástrojů cloudových platforem. S růstem adopce agentické AI se ale dá očekávat, že podobné funkce začnou nabízet i evropští a čeští poskytovatelé.