Claude Opus 4.8 je tady: Anthropic vydal model, který poráží GPT-5.5 a poprvé umí říct 'tím si nejsem jistý'

29. 5. 2026 Daniel Česák

Anthropic vydal Claude Opus 4.8 — nový vlajkový model, který firma sama označuje za „skromné, ale hmatatelné zlepšení". Ve většině benchmarků poráží GPT-5.5 od OpenAI i Gemini 3.1 Pro od Googlu. Nejvýraznější změna ale není jen v číslech — nový Opus se naučil přiznávat vlastní nejistotu. A to je v éře agentní AI důležitější, než se na první pohled zdá.

Benchmarky: Opus 4.8 na špici

Anthropic zveřejnil kompletní systémovou kartu a v ní desítky srovnání. V agentním kódování na testu SWE-Bench Pro dosáhl Opus 4.8 na 69,2 % — to je skok z 64,3 % u předchozího Opusu 4.7 a výrazně před 58,6 % u GPT-5.5.

V multidisciplinárním uvažování na testu Humanity's Last Exam, který obsahuje expertní otázky napříč obory, získal Opus 4.8 49,8 % bez nástrojů a 57,9 % s nástroji. Oba výsledky jsou aktuálně nejvyšší ze všech dostupných modelů.

Na praktickém benchmarku GDPval-AA, který testuje reálné znalostní úkoly, dosáhl Opus 4.8 na maximální úrovni úsilí 1 890 bodů — o 137 bodů více než Opus 4.7 a o 121 bodů před GPT-5.5. V přímém souboji s GPT-5.5 vyhrává zhruba v 67 % případů.

Upřímnost jako nová metrika

Jednou z nejdiskutovanějších vlastností nového modelu je vylepšená upřímnost (honesty). Velké jazykové modely mají tendenci halucinovat a sebevědomě tvrdit věci, které si ve skutečnosti vymyslely. Opus 4.8 je podle Anthropicu zhruba čtyřikrát méně pravděpodobné, že nechá projít chybu v kódu bez komentáře.

„První testeři uvádějí, že Opus 4.8 častěji označuje nejistoty ve své práci a méně často tvrdí nepodložené závěry," píše Anthropic v oficiálním oznámení. To potvrzují i nezávislí testeři — například investiční analytik Michael Ran ze společnosti Blackstone uvedl, že „největším rozdílem byla tendence Opusu 4.8 proaktivně upozorňovat na problémy se vstupy a výstupy analýzy, což jiné modely rutinně přehlížely".

Pro profesionální nasazení — ať už v právu, financích nebo zdravotnictví — je to zásadní posun. Model, který přizná, že si není jistý, je bezpečnější než model, který si vymýšlí.

Dynamické workflow: Stovky agentů v jednom sezení

Vedle samotného modelu Anthropic představil funkci dynamických workflow, která může být pro vývojáře důležitější než samotný upgrade modelu. Claude nyní dokáže naplánovat úkol a následně spustit stovky paralelních sub-agentů v jediném sezení.

V Claude Code to znamená, že Opus 4.8 zvládne celokódové migrace napříč stovkami tisíc řádků — od prvního plánování až po merge. „Claude Code s Opus 4.8 nyní provede migraci celé kódové základny od začátku do konce, přičemž jako laťku kvality používá existující testovací sadu," vysvětluje Anthropic. Funkce je dostupná v Claude Code na plánech Enterprise, Team a Max.

Ovládání úsilí: Vy rozhodujete, jak moc Claude přemýšlí

Novinkou na claude.ai a v desktopové aplikaci Cowork je přepínač úsilí vedle voliče modelu. Uživatel si může vybrat ze čtyř úrovní:

Low — rychlé odpovědi, nižší spotřeba tokenů
High (výchozí) — nejlepší poměr kvality a rychlosti
Extra (v Claude Code jako xhigh) — pro obtížné úkoly
Max — maximální hloubka uvažování, nejvyšší spotřeba tokenů

Anthropic současně navýšil limity v Claude Code, aby vyšší úrovně úsilí neblokovaly práci. Prakticky to znamená, že na složitý výzkumný nebo vývojářský úkol můžete modelu „dovolit" přemýšlet déle, zatímco na rychlé dotazy šetříte čas i limity.

Ceny zůstávají stejné — reálné náklady ale klesají

API ceny zůstávají beze změny oproti Opusu 4.7: 5 USD za milion vstupních tokenů a 25 USD za milion výstupních tokenů. Zajímavější je ale efektivita — podle analýzy Artificial Analysis potřebuje Opus 4.8 na benchmarku GDPval-AA o 15 % méně průchodů na úlohu a o 35 % méně výstupních tokenů než Opus 4.7.

Rychlý režim (Fast Mode), který běží na 2,5násobné rychlosti, nově stojí 10 USD za milion vstupních tokenů a 50 USD za milion výstupních tokenů — třetinu toho, co stál u předchozích modelů.

Dostupnost v Česku a pro české uživatele

Claude Opus 4.8 je od 28. května 2026 dostupný všude — přes claude.ai, Claude Code, Cowork i přes API s identifikátorem claude-opus-4-8. Claude podporuje češtinu — můžete s ním komunikovat česky a model bude odpovídat v češtině, byť s občasnými drobnými nepřesnostmi typickými pro negenerativní jazyky. Pro české vývojáře a firmy je to plnohodnotná alternativa ke GPT-5.5, zejména pro úlohy vyžadující pečlivost a transparentnost.

Pro evropské firmy je důležité, že Anthropic nabízí regionální compliance a modely běží i na evropské infrastruktuře (například přes Google Cloud Vertex AI v EU regionech).

Co bude dál: Mythos na obzoru

Anthropic zároveň potvrdil, že modely třídy Claude Mythos — výrazně výkonnější než Opus — by se měly dostat k zákazníkům „v následujících týdnech". V tuto chvíli je Mythos Preview dostupný jen omezenému počtu organizací v rámci Project Glasswing pro kyberbezpečnostní účely. Anthropic pracuje na bezpečnostních opatřeních, která umožní širší distribuci.

Je Claude Opus 4.8 lepší než GPT-5.5?

Ve většině benchmarků ano — Opus 4.8 poráží GPT-5.5 v agentním kódování (SWE-Bench Pro: 69,2 % vs 58,6 %), v multidisciplinárním uvažování (Humanity's Last Exam) i v praktických znalostních úkolech (GDPval-AA). V přímém souboji vyhrává zhruba 67 % případů. GPT-5.5 je nadále silnější v některých specifických doménách, zejména tam, kde OpenAI investovalo do specializovaného tréninku.

Kolik stojí používání Claude Opus 4.8 přes API?

Standardní ceny jsou 5 USD za milion vstupních tokenů a 25 USD za milion výstupních tokenů — stejně jako u Opusu 4.7. Rychlý režim vyjde na 10/50 USD za milion tokenů. V praxi ale může být Opus 4.8 levnější než předchůdce, protože podle analýz potřebuje o 15 % méně průchodů a o 35 % méně výstupních tokenů na stejné úkoly.

Podporuje Claude Opus 4.8 češtinu?

Ano, Claude rozumí česky a dokáže v češtině odpovídat. Model je trénován na mnohojazyčných datech včetně češtiny a slovenštiny. Pro profesionální použití v češtině je však vhodné ověřovat faktickou správnost výstupů, zejména u specializovaných témat, kde může model čerpat převážně z anglických zdrojů.