Co je Browse.sh a proč existuje
Browserbase, americký startup budující infrastrukturu pro prohlížečové AI agenty, spustil 18. května 2026 projekt Browse.sh. Jde o kombinaci dvou věcí: veřejného katalogu prohlížečových dovedností (tzv. skills) a open-source CLI nástroje, který si nainstalujete jediným příkazem npm i -g browse.
„Dovednost" je v tomto kontextu markdown soubor (SKILL.md), který obsahuje přesný návod, jak na konkrétním webu splnit určitý úkol. Zahrnuje selektory, API endpointy, časté chyby, fallback strategie a specifické záludnosti dané stránky. Žádné vektorové embeddings, žádné screenshoty — jen čistý text, kterému rozumí člověk i agent.
Za projektem stojí tým ve složení Kyle Jeong, Shubhankar Srivastava, Alex Qiu a Shrey Pandya. Katalog spouští se 100 dovednostmi pokrývajícími marketplace (Craigslist, Amazon, eBay), cestování (Google Flights, Airbnb, Booking.com), gastro (OpenTable, DoorDash), státní správu i vývojářské nástroje (GitHub, npm).
Problém, který Browse.sh řeší: amnézie agentů
AI agenti, ať už v Claude Code, Cursoru nebo Codexu, dnes sdílí jeden zásadní nedostatek. Pokaždé, když dostanou úkol na webu, musí stránku znovu „objevit". Otevřou prohlížeč, hledají správné tlačítko, klikají, parsují odpověď — a po skončení relace všechno zapomenou. Příští spuštění začíná znovu od nuly.
Browserbase tento fenomén nazývá „discovery tax" — daň za objevování, kterou platíte při každém běhu agenta. Na benchmarku s Craigslistem tým naměřil, že generický agent zaplatí za jedno vyhledání inzerátů přibližně 0,22 USD. Musí při tom sám přijít na to, že stránka s výsledky je plně renderovaná JavaScriptem, objevit skryté JSON API na sapi.craigslist.org, pochopit dekódování pozičního pole a vyřešit geolokační omezení podle IP adresy.
Po čtyřech iteracích systému Autobrowse (o něm níže) však výsledná dovednost provede stejnou úlohu za 0,12 USD — tedy o 45 % levněji. „Každý další běh je levnější, protože dovednost obsahuje nejkratší spolehlivou cestu, kterou agent našel, a znovu ji používá místo toho, aby ji znovu odvozoval," vysvětluje Kyle Jeong na blogu Browserbase.
Jak Browse.sh funguje
Základní workflow je překvapivě jednoduché:
- Instalace CLI:
npm i -g browse - Výběr dovednosti: Na webu browse.sh najdete skill pro cílový web (např.
zillow.com/extract-listings) - Instalace dovednosti:
browse skills add zillow.com/extract-listings - Spuštění agenta: Agent načte SKILL.md, následuje popsaný postup a vrátí strukturovaný výsledek
Typický prompt pak vypadá například: Use /extract-listings to find apartments under $3,000 in SF with 2+ bedrooms. Agent přečte dovednost, provede workflow podle návodu, ošetří krajní případy podle zdokumentovaných „gotchas" a vrátí strukturovaná data.
Každá dovednost obsahuje sekce jako Site-Specific Gotchas — například u Craigslist dovednosti je uvedeno, že item[0] není posting ID, ale offset, a že API geolokuje podle IP adresy (lze override s parametrem postal=ZIP). To jsou informace, které by lidskému vývojáři zabraly hodiny reverzního inženýrství a agentovi desítky dolarů v tokenech.
Autobrowse: AI, které vylepšuje AI
Klíčovou technologií za Browse.sh je systém Autobrowse, který Browserbase představil začátkem května 2026. Jde o samo-zlepšovací smyčku: agent dostane reálný úkol na konkrétním webu, provede ho, přečte si vlastní trasování (trace) a iterativně vylepšuje svoji strategii, dokud nedosáhne spolehlivého výsledku.
„Místo klikání krok za krokem se agent rozhodne evaluovat JavaScript přímo na stránce a uložit si tento workflow jako dovednost," popsal Kyle Jeong na síti X. V příkladu s Hacker News dvě iterace Autobrowse zkrátily čas z 102 na 35 sekund, počet kroků z 23 na 8 a cenu z 1,46 USD na 0,28 USD.
Výsledná dovednost je pak publikována do otevřeného katalogu na browse.sh, kde je k dispozici komukoli. Pokud požadovaný web v katalogu není, stačí na browse.sh zadat doménu a popis úkolu — Autobrowse dovednost vygeneruje a publikuje.
Pro koho je Browse.sh určen
Primární cílovou skupinou jsou AI vývojáři, kteří staví agenty pro automatizaci webových úloh — ať už jde o extrakci dat, vyplňování formulářů, testování nebo monitoring. Dále produktové týmy, které nasazují prohlížečové funkce a potřebují deterministické, auditovatelné playbooky místo černých skříněk agentních běhů.
Browse.sh je open-source a zdarma. Zdrojový kód dovedností je dostupný na GitHubu, kde repozitář browserbase/skills nasbíral už přes 3 400 hvězd. Katalog využívá standard AgentSkills, který se prosazuje napříč ekosystémem — podporují ho Claude Code, OpenAI Codex i další agentní frameworky.
Český a evropský kontext
Browse.sh je globálně dostupný nástroj bez jazykových bariér — dovednosti jsou psané anglicky, ale samotný koncept otevřeného katalogu dovedností může využít každý český vývojář pracující s AI agenty. Pro české firmy, které experimentují s Claude Code, Cursor nebo Codex (například pro automatizaci testování či extrakci dat z webů), představuje Browse.sh cestu k výrazně nižším provozním nákladům.
V evropském kontextu je důležitá i skutečnost, že Browse.sh je open-source a transparentní — dovednosti jsou čitelné pro lidi i stroje, což usnadňuje auditovatelnost v souladu s EU AI Actem. České startupy a vývojářské týmy, které staví AI řešení pro evropský trh, tak mohou Browse.sh integrovat bez obav z regulatorních komplikací.
Browserbase, mateřská společnost za Browse.sh, je americký startup ze San Francisca. Kromě Browse.sh provozuje cloudovou platformu pro prohlížečovou automatizaci, která zahrnuje správu relací, automatické řešení CAPTCHA, rezidentní proxy a další nástroje pro spolehlivé procházení webu. Mezi jejich zákazníky patří společnosti jako Ramp, Lovable, Poke a Reducto.
Co to znamená pro budoucnost AI agentů
Browse.sh přichází v době, kdy se agentní AI stává mainstreamem. Jak trefně poznamenává Kyle Jeong: „Úzkým hrdlem pro prohlížečové agenty nikdy nebyla inteligence. Byla to amnézie." I kdybychom měli dokonalý model, který bezchybně rozumí každé webové stránce, stále by musel každou stránku objevovat znovu — pokud by neměl kam uložit, co se naučil.
Browse.sh tento problém řeší elegantně: paměť, která se skládá. Každá nová dovednost obohacuje katalog, každý nový uživatel přináší další weby a každý další běh agenta je levnější než ten předchozí. V době, kdy firmy počítají každý dolar za tokeny (a ceny modelů jako GPT-5.5 nebo Claude Opus 4.7 rozhodně neklesají), je to konkurenční výhoda, kterou nelze ignorovat.
Je Browse.sh vhodný i pro začátečníky, kteří s AI agenty teprve začínají?
Ano, Browse.sh je navržen tak, aby byl přístupný i vývojářům bez hlubokých znalostí prohlížečové automatizace. Stačí nainstalovat CLI přes npm, vybrat si dovednost z katalogu a váš agent ji okamžitě použije. Dovednosti jsou psané v přehledném formátu Markdown, takže jim rozumí jak stroj, tak člověk — můžete si je prostudovat a případně upravit podle vlastních potřeb.
Jak Browse.sh řeší situace, kdy cílový web změní svou strukturu?
Pokud web změní layout nebo API, existující dovednost může přestat spolehlivě fungovat. V takovém případě stačí na browse.sh zadat stejnou doménu a úkol znovu — systém Autobrowse provede novou iteraci proti aktuální verzi webu, najde novou optimální cestu a vygeneruje aktualizovanou dovednost. Ta se následně publikuje do katalogu pro všechny uživatele.
Mohu Browse.sh používat pro weby v češtině nebo pro české e-shopy?
Browse.sh nemá jazyková omezení — dovednosti lze vytvořit pro jakýkoli web bez ohledu na jazyk. Pokud v katalogu chybí dovednost pro český e-shop nebo službu, můžete ji nechat vygenerovat přes Autobrowse zadáním domény a popisu úkolu. Nová dovednost se stane součástí otevřeného katalogu a bude k dispozici všem.