Benchmarky: Opus 4.8 na špici
Anthropic zveřejnil kompletní systémovou kartu a v ní desítky srovnání. V agentním kódování na testu SWE-Bench Pro dosáhl Opus 4.8 na 69,2 % — to je skok z 64,3 % u předchozího Opusu 4.7 a výrazně před 58,6 % u GPT-5.5.
V multidisciplinárním uvažování na testu Humanity's Last Exam, který obsahuje expertní otázky napříč obory, získal Opus 4.8 49,8 % bez nástrojů a 57,9 % s nástroji. Oba výsledky jsou aktuálně nejvyšší ze všech dostupných modelů.
Na praktickém benchmarku GDPval-AA, který testuje reálné znalostní úkoly, dosáhl Opus 4.8 na maximální úrovni úsilí 1 890 bodů — o 137 bodů více než Opus 4.7 a o 121 bodů před GPT-5.5. V přímém souboji s GPT-5.5 vyhrává zhruba v 67 % případů.
Upřímnost jako nová metrika
Jednou z nejdiskutovanějších vlastností nového modelu je vylepšená upřímnost (honesty). Velké jazykové modely mají tendenci halucinovat a sebevědomě tvrdit věci, které si ve skutečnosti vymyslely. Opus 4.8 je podle Anthropicu zhruba čtyřikrát méně pravděpodobné, že nechá projít chybu v kódu bez komentáře.
„První testeři uvádějí, že Opus 4.8 častěji označuje nejistoty ve své práci a méně často tvrdí nepodložené závěry," píše Anthropic v oficiálním oznámení. To potvrzují i nezávislí testeři — například investiční analytik Michael Ran ze společnosti Blackstone uvedl, že „největším rozdílem byla tendence Opusu 4.8 proaktivně upozorňovat na problémy se vstupy a výstupy analýzy, což jiné modely rutinně přehlížely".
Pro profesionální nasazení — ať už v právu, financích nebo zdravotnictví — je to zásadní posun. Model, který přizná, že si není jistý, je bezpečnější než model, který si vymýšlí.
Dynamické workflow: Stovky agentů v jednom sezení
Vedle samotného modelu Anthropic představil funkci dynamických workflow, která může být pro vývojáře důležitější než samotný upgrade modelu. Claude nyní dokáže naplánovat úkol a následně spustit stovky paralelních sub-agentů v jediném sezení.
V Claude Code to znamená, že Opus 4.8 zvládne celokódové migrace napříč stovkami tisíc řádků — od prvního plánování až po merge. „Claude Code s Opus 4.8 nyní provede migraci celé kódové základny od začátku do konce, přičemž jako laťku kvality používá existující testovací sadu," vysvětluje Anthropic. Funkce je dostupná v Claude Code na plánech Enterprise, Team a Max.
Ovládání úsilí: Vy rozhodujete, jak moc Claude přemýšlí
Novinkou na claude.ai a v desktopové aplikaci Cowork je přepínač úsilí vedle voliče modelu. Uživatel si může vybrat ze čtyř úrovní:
- Low — rychlé odpovědi, nižší spotřeba tokenů
- High (výchozí) — nejlepší poměr kvality a rychlosti
- Extra (v Claude Code jako xhigh) — pro obtížné úkoly
- Max — maximální hloubka uvažování, nejvyšší spotřeba tokenů
Anthropic současně navýšil limity v Claude Code, aby vyšší úrovně úsilí neblokovaly práci. Prakticky to znamená, že na složitý výzkumný nebo vývojářský úkol můžete modelu „dovolit" přemýšlet déle, zatímco na rychlé dotazy šetříte čas i limity.
Ceny zůstávají stejné — reálné náklady ale klesají
API ceny zůstávají beze změny oproti Opusu 4.7: 5 USD za milion vstupních tokenů a 25 USD za milion výstupních tokenů. Zajímavější je ale efektivita — podle analýzy Artificial Analysis potřebuje Opus 4.8 na benchmarku GDPval-AA o 15 % méně průchodů na úlohu a o 35 % méně výstupních tokenů než Opus 4.7.
Rychlý režim (Fast Mode), který běží na 2,5násobné rychlosti, nově stojí 10 USD za milion vstupních tokenů a 50 USD za milion výstupních tokenů — třetinu toho, co stál u předchozích modelů.
Dostupnost v Česku a pro české uživatele
Claude Opus 4.8 je od 28. května 2026 dostupný všude — přes claude.ai, Claude Code, Cowork i přes API s identifikátorem claude-opus-4-8. Claude podporuje češtinu — můžete s ním komunikovat česky a model bude odpovídat v češtině, byť s občasnými drobnými nepřesnostmi typickými pro negenerativní jazyky. Pro české vývojáře a firmy je to plnohodnotná alternativa ke GPT-5.5, zejména pro úlohy vyžadující pečlivost a transparentnost.
Pro evropské firmy je důležité, že Anthropic nabízí regionální compliance a modely běží i na evropské infrastruktuře (například přes Google Cloud Vertex AI v EU regionech).
Co bude dál: Mythos na obzoru
Anthropic zároveň potvrdil, že modely třídy Claude Mythos — výrazně výkonnější než Opus — by se měly dostat k zákazníkům „v následujících týdnech". V tuto chvíli je Mythos Preview dostupný jen omezenému počtu organizací v rámci Project Glasswing pro kyberbezpečnostní účely. Anthropic pracuje na bezpečnostních opatřeních, která umožní širší distribuci.
Je Claude Opus 4.8 lepší než GPT-5.5?
Ve většině benchmarků ano — Opus 4.8 poráží GPT-5.5 v agentním kódování (SWE-Bench Pro: 69,2 % vs 58,6 %), v multidisciplinárním uvažování (Humanity's Last Exam) i v praktických znalostních úkolech (GDPval-AA). V přímém souboji vyhrává zhruba 67 % případů. GPT-5.5 je nadále silnější v některých specifických doménách, zejména tam, kde OpenAI investovalo do specializovaného tréninku.
Kolik stojí používání Claude Opus 4.8 přes API?
Standardní ceny jsou 5 USD za milion vstupních tokenů a 25 USD za milion výstupních tokenů — stejně jako u Opusu 4.7. Rychlý režim vyjde na 10/50 USD za milion tokenů. V praxi ale může být Opus 4.8 levnější než předchůdce, protože podle analýz potřebuje o 15 % méně průchodů a o 35 % méně výstupních tokenů na stejné úkoly.
Podporuje Claude Opus 4.8 češtinu?
Ano, Claude rozumí česky a dokáže v češtině odpovídat. Model je trénován na mnohojazyčných datech včetně češtiny a slovenštiny. Pro profesionální použití v češtině je však vhodné ověřovat faktickou správnost výstupů, zejména u specializovaných témat, kde může model čerpat převážně z anglických zdrojů.