Špičkové benchmarky a agentní výkon
Podle nezávislého hodnocení Artificial Analysis dosáhl Grok 4.3 na Intelligence Indexu hodnoty 53 bodů, čímž se umístil na sedmém místě celkového pořadí. Předčil tak například model Muse Spark nebo Claude Sonnet 4.6 a o čtyři body překonal svého předchůdce Grok 4.20. Nejvýraznějšího zlepšení se však model dočkal právě v oblasti agentních úkolů — tedy v scénářích, kdy AI sama volá nástroje, prochází data a plní složité instrukce.
Na benchmarku GDPval-AA, který měří výkon na reálných ekonomicky hodnotných úkolech s přístupem k webu a terminálu, získal Grok 4.3 ELO 1500. To je o 321 bodů více než u předchozí verze Grok 4.20 a znamená to, že model překonal Gemini 3.1 Pro Preview, Muse Spark, GPT-5.4 mini i Kimi K2.5. Ke špičce mu schází ještě několik set bodů na vedoucí GPT-5.5 (xhigh), nicméně jeho výkonnostní skok je v této kategorii jedním z nejvýraznějších za poslední měsíce.
V oblasti instruction following (sledování instrukcí) si Grok 4.3 vedl rovněž excelentně: na benchmarku 𝜏²-Bench Telecom dosáhl 98 % a na IFBench udržel 81 %. Tyto testy ověřují, jak precizně model dodržuje zadané pokyny — klíčovou dovednost pro automatizaci podnikových procesů.
Dominance v podnikových doménách
Kromě obecných žebříčků si xAI pochvaluje i výsledky v testech společnosti ValsAI, která se zaměřuje na specifické odvětví. Zde Grok 4.3 obsadil první místo v kategoriích case law (právní případy) s přesností 79,3 % a corporate finance (firemní finance) s výsledkem 68,5 %. V celkovém Vals Indexu se model umístil na 13. příčce ze 46 hodnocených modelů s celkovým skóre 62,6 %.
Právě tato specializace může být pro české a evropské firmy zajímavá. Právní a finanční domény patří mezi oblasti, kde se umělá inteligence nejrychleji prosazuje, a schopnost modelu porozumět složitým právním dokumentům nebo finančním výkazům otevírá možnosti pro automatizaci compliance, due diligence nebo právního výzkumu.
Rychlost a kontextové okno
xAI označuje Grok 4.3 za svůj dosud nejrychlejší model. Podle měření Artificial Analysis generuje 107 tokenů za sekundu, což ho řadí na čtvrté místo v rychlostním žebříčku za modely jako gpt-oss-120B nebo Gemini 3.1 Pro Preview. Pro vývojáře to znamená výrazně plynulejší interakci i při práci s dlouhými dokumenty.
Klíčovou výhodou je i milionový kontext — tedy schopnost modelu zpracovat najednou ekvivalent zhruba 750 tisíc slov v češtině. To umožňuje analýzu celých knih, rozsáhlých právních spisů, zdrojových kódů velkých projektů nebo kompletních finančních výkazů bez nutnosti je dělit na části. V praxi to výrazně zjednodušuje workflow, kde je potřeba porovnávat data z více zdrojů najednou.
Cena, která tlačí na konkurenci
Jedním z nejsilnějších taháků Grok 4.3 je cena. xAI stanovila sazby na 1,25 $ za milion vstupních tokenů a 2,50 $ za milion výstupních tokenů. V porovnání s předchozí verzí Grok 4.20 jde o snížení vstupní ceny o 37,5 % a výstupní o 58,3 %. Podle výpočtů Artificial Analysis tak stojí spuštění kompletní sady benchmarků 395 $, což je o zhruba 20 % méně než u předchůdce.
V kontextu trhu to znamená, že Grok 4.3 patří mezi nejefektivnější modely své třídy z hlediska poměru ceny a výkonu. V blended ceně (poměr vstupu a výstupu 3:1) vychází na 1,6 $ za milion tokenů, což je méně než u Gemini 3.1 Pro Preview (4,5 $), GPT-5.4 (5,6 $) nebo Claude Opus 4.7 (10,9 $). Pro evropské startupy a vývojáře to může být zajímavá alternativa při stavbě aplikací, kde hraje roli nejen výkon, ale i provozní náklady.
Dostupnost v Česku a Evropě
Model je dostupný prostřednictvím xAI API, které je přístupné globálně včetně Evropské unie. Pro české vývojáře a firmy to znamená možnost začlenit Grok 4.3 do vlastních aplikací bez geografického omezení. Koncoví uživatelé mohou model využívat také prostřednictvím předplatného na sociální síti X (dříve Twitter), kde je Grok integrován do vyšších úrovní předplatného.
Podpora češtiny není z oficiální strany xAI explicitně deklarována, nicméně modely této třídy obvykle ovládají desítky jazyků včetně českého. Pro náročné právní nebo finanční úkoly v českém prostředí je však stále vhodné ověřit kvalitu výstupů na konkrétních datových sadách. Vzhledem k tomu, že se jedná o uzavřený proprietární model, firmy by měly také zohlednit požadavky EU AI Act, zejména pokud plánují nasazení v regulovaných oblastech jako je právo nebo finanční poradenství.
Srovnání s konkurencí v kostce
| Model | Intelligence Index | Rychlost (tok/s) | Cena 1M tokenů (blend) |
|---|---|---|---|
| GPT-5.5 (xhigh) | 60 | 76 | 11,3 $ |
| Claude Opus 4.7 | 57 | 49 | 10,9 $ |
| Gemini 3.1 Pro Preview | 57 | 137 | 4,5 $ |
| Grok 4.3 | 53 | 107 | 1,6 $ |
| DeepSeek V4 Pro | 52 | 34 | 2,2 $ |
Závěr
Grok 4.3 je pro xAI významným krokem vpřed. Zatímco v absolutním intelektuálním výkonu stále zaostává za špičkami jako GPT-5.5 nebo Claude Opus 4.7, v oblasti agentních úkolů a sledování instrukcí se dokázal vyšplhat mezi absolutní špičku. Kombinace s agresivní cenovou politikou a milionovým kontextem z něj dělá zajímavý nástroj pro vývojáře i firmy, které hledají výkonný, ale finančně dostupný model pro automatizaci složitých workflow.
Pro českou scénu je zpráva o další konkurenci na poli velkých jazykových modelů povzbudivá — tlak na ceny a zvyšování výkonu totiž v konečném důsledku prospívá všem uživatelům, od individuálních vývojářů po velké korporace.
Jak se Grok 4.3 liší od verze Grok 4.20?
Grok 4.3 přináší zejména výrazné zlepšení v agentních úkolech (nárůst o 321 ELO bodů na GDPval-AA), rychlejší generování textu a výrazně nižší cenu — o 37,5 % na vstupu a 58,3 % na výstupu. Zároveň je to první model xAI s kontextovým oknem o délce 1 milion tokenů.
Můžu použít Grok 4.3 pro české právní nebo finanční texty?
API je dostupné z České republiky i celé EU, a model teoreticky podporuje češtinu jako jeden z mnoha jazyků. Pro náročné právní nebo finanční úkoly v českém prostředí je však vhodné provést vlastní ověření kvality výstupů, protože benchmarky ValsAI byly měřeny primárně na anglických datech.
Je Grok 4.3 open-source?
Ne, Grok 4.3 je uzavřený proprietární model dostupný pouze přes API společnosti xAI nebo v rámci předplatného na platformě X. V současné době xAI nezveřejňuje váhy modelu ani technické detaily o jeho architektuře.