Kdo je Sarvam AI a proč je důležitý
Sarvam AI vznikla v srpnu 2023 v indickém Bengaluru a za necelé tři roky se stala jedním z nejambicióznějších AI startupů na světě. Zakladatelé Dr. Vivek Raghavan a Dr. Pratyush Kumar mají za sebou zkušenosti s budováním digitální veřejné infrastruktury v Indii a s open-source výzkumem v oblasti indických jazyků. Společnost získala 41 milionů dolarů od investorů včetně Lightspeed, Peak XV Partners a Khosla Ventures.
Hlavním cílem Sarvam je postavit plně suverénní AI platformu — tedy technologii, která je vyvinutá, trénovaná i provozovaná výhradně v Indii, na indických datových centrech a pod indickou kontrolou. V době, kdy se Evropa i další regiony bouří proti závislosti na amerických a čínských technologiích, představuje tento přístup zajímavý model i pro české a evropské politiky i firmy.
Dva modely, jedna filozofie
V březnu 2026 společnost otevřela zdrojové kódy dvou svých modelů — Sarvam 30B a Sarvam 105B. Oba jsou postavené na architektuře Mixture-of-Experts (MoE), což znamená, že model obsahuje mnoho „expertů“ (specifických podmodelů), ale při každém výpočtu aktivuje jen malou část z nich. To šetří výpočetní výkon i náklady.
Sarvam 30B: Efektivní všestránnost
Menší model má celkově 30 miliard parametrů, ale aktivních je pouze 2,4 miliardy. To ho činí extrémně rychlým a levným na provoz. Přesto dosahuje pozoruhodných výsledků: na benchmarku Math500 získal 97,0 bodů, na HumanEval (programování) 92,1 a na MMLU (obecné znalosti) 85,1. Tyto výsledky jsou srovnatelné nebo lepší než u modelů jako Gemma 27B, Qwen3-30B nebo GPT-OSS-20B.
Díky optimalizaci pro inference dokáže Sarvam 30B běžet i na běžném MacBooku Pro s čipem M3, kde je o 20–40 % rychlejší než srovnatelné modely. To z něj dělá zajímavou volbu pro vývojáře, kteří chtějí lokální AI bez nutnosti cloudových služeb.
Sarvam 105B: Hranice frontier modelů
Větší model s 105 miliardami parametrů už konkuruje skutečným frontier modelům. Na AIME 25 (matematická olympiáda) dosáhl 88,3 bodů, na GPQA Diamond (vědecké zkoumání na úrovni PhD) 78,7 a na LiveCodeBench 71,7. V agentických úlohách — tedy schopnosti plánovat, vyhledávat a dokončovat složité vícekrokové úkoly — dokonce překonal modely jako DeepSeek R1, Gemini 2.5 Flash i Claude 4 Sonnet.
Na benchmarku BrowseComp, který měří schopnost modelu procházet web a vyhledávat informace, získal Sarvam 105B 49,5 bodů. Pro srovnání: DeepSeek R1 dosáhl pouhých 3,2 a Gemini 2.5 Flash 20,0. Na Tau2, testu dlouhodobého agentického uvažování, vedl s 68,3 body.
Výhoda v indických jazycích
Největší unikátnost Sarvam modelů spočívá v jejich znalosti 22 indických jazyků včetně psaní v původních i latinkou transkribovaných podobách. Na vlastním benchmarku IndicVibe vyhrál Sarvam 105B v průměru 90 % porovnání napříč všemi dimenzemi a 84 % ve STEM oblastech. Menší 30B model dokonce 89 %, přičemž v technických oborech dosáhl 87 %.
Tokenizer Sarvam je speciálně optimalizován pro indické jazyky a potřebuje výrazně méně tokenů než běžné tokenizátory. To přímo snižuje cenu a latenci při použití v indických jazycích — pro tamní trh zásadní výhoda.
Co to znamená pro české uživatele a vývojáře?
Pro české čtenáře je Sarvam AI zajímý hned z několika důvodů:
1. Open-source a zdarma: Oba chatovací modely (30B i 105B) jsou k dispozici zdarma přes API. Váhy modelů lze stáhnout z Hugging Face i z indického repozitáře AI Kosh. Čeští vývojáři tak mohou experimentovat s frontier-kvalitním modelem bez jakýchkoli nákladů na licence.
2. Lokální provoz: Díky optimalizacím lze 30B model provozovat lokálně. Pro české firmy zpracovávající citlivá data to může být zajímavá alternativa k placeným API od OpenAI nebo Google, zejména s ohledem na GDPR a požadavky EU AI Act.
3. Čeština není primární jazyk: Na rozdíl od indických jazyků není čeština pro Sarvam modely nativní. Přestože modely by měly fungovat i v češtině díky multilingválnímu trénování, nedosáhnou zde takové kvality jako v angličtině nebo hindštině. Pro české firmy to znamená, že Sarvam je zatím spíše zajímavou technologií pro experimenty než přímou náhradu lokalizovaných řešení.
4. Suverenita jako vzor pro Evropu: Evropská snaha o vlastní AI infrastrukturu — od projektu EuroHPC po různé národní iniciativy — může čerpat inspiraci z indického přístupu. Sarvam dokazuje, že země s dostatečným politickým odhodláním a investicemi dokáže vybudovat konkurenceschopnou AI základnu bez závislosti na Silicon Valley.
Jak modely vyzkoušet
Sarvam nabízí několik způsobů, jak se s modely seznámit:
- Indus — chatovací aplikace postavená na 105B modelu, dostupná v omezené beta verzi
- Samvaad — platforma pro konverzační agenty pro firmy, poháněná 30B modelem
- API dashboard — vývojářské rozhraní s 1 000 indických rupií (cca 270 Kč) ve free kreditech
- Lokální inference — váhy lze stáhnout a spustit přes Transformers, vLLM nebo SGLang
API je přístupné globálně, takže čeští vývojáři se mohou registrovat bez geografického omezení.
Konkurence na dosah
Zatímco Sarvam 105B nepřekonává absolutně nejnovější modely jako o4-mini nebo největší proprietární systémy, jeho poměr cena/výkon a otevřenost z něj dělají vážného hráče. Fakt, že indický startup dokáže v krátké době vybudovat plnohodnotný „full stack“ — od sběru dat přes trénování až po inference a produkty — je signálem, že globální AI trh se začíná fragmentovat.
Pro české firmy a vývojáře to znamená větší výběr, nižší závislost na amerických providerech a přístup k špičkovým modelům bez vendor lock-inu. Ať už jde o experimenty s lokálně běžícím 30B modelem, nebo o testování agentických schopností 105B varianty, Sarvam AI si zaslouží pozornost.
Mohu Sarvam modely používat komerčně v České republice?
Ano, oba modely jsou open-source a jejich váhy jsou veřejně dostupné na Hugging Face. API je globálně přístupné a komerční využití je možné, i když si vždy ověřte aktuální licenční podmínky na oficiálním webu Sarvam AI.
Jaký je rozdíl mezi Sarvam 30B a 105B pro praktické použití?
30B model je optimalizován pro rychlost a nízké náklady — běží i na notebooku a je ideální pro konverzační agenty a reálné nasazení. 105B model nabízí vyšší kvalitu reasoningu, programování a agentických úloh, ale vyžaduje výkonnější hardware.
Podporuje Sarvam češtinu stejně dobře jako angličtinu?
Ne. Modely jsou trénovány primárně na angličtině a 22 indických jazycích. Čeština funguje, ale kvalita pravděpodobně nedosahuje úrovně specializovaných evropských modelů nebo proprietárních systémů jako GPT-4o či Gemini, které mají rozsáhlejší multilingvální trénink.