Přejít k hlavnímu obsahu

Sarvam AI postavil AI modely se 105 miliardami parametrů. Indický startup na to stačilo 40 výzkumníků

AI trh a startupy
Indický startup Sarvam AI dokázal se 40 výzkumníky postavit vlastní jazykové modely o 105 miliardách parametrů — od nuly, bez závislosti na jakékoliv externí technologii. Zatímco čínský DeepSeek na své modely nasadil přibližně 5 000 lidí, bengalúrská laboratoř ukazuje, že i extrémně úsporný přístup může vést ke konkurenceschopným výsledkům. Modely už testují první firmy a vládní instituce.

40 lidí, 4 000 GPU, žádná externí podpora

Sarvam AI, založený v roce 2023, vsadil na strategii „frugální AI" — tedy vývoj s minimálními zdroji při maximální soběstačnosti. Spoluzakladatel Pratyush Kumar v rozhovoru pro The Economic Times uvedl, že firma postavila celý technologický stack bez jediné externí závislosti. „Ani v datech, ani v algoritmech, ani v inženýrství nemáme závislost na žádné externí společnosti," řekl.

Trénink probíhal na 4 000 grafických procesorech po dobu šesti měsíců. Výsledkem jsou modely o velikostech 3 miliard, 30 miliard a 105 miliard parametrů. V globálním měřítku jde podle Kumara o „extrémně úsporný" přístup — pro srovnání, trénink modelů GPT-4 od OpenAI stál odhadem přes 100 milionů dolarů a vyžadoval řádově desetitisíce GPU.

Co Sarvam umí: modely, hlas, obraz

Největší model Sarvam 105B používá architekturu mixture-of-experts (MoE), což znamená, že při každém dotazu aktivuje jen zlomek ze svých 105 miliard parametrů — to dramaticky snižuje výpočetní náklady. Podporuje kontextové okno o délce 128 000 tokenů, tedy zvládne zpracovat ekvivalent zhruba 300 stran textu najednou. Sarvam ho na svých materiálech srovnává s modely jako OpenAI GPT-OSS-120B nebo Alibaba Qwen-3-Next-80B.

Menší Sarvam 30B cílí na konverzační nasazení v reálném čase s kontextovým oknem 32 000 tokenů. Oba modely byly trénovány od nuly — nejde o „pouhé" dolaďování existujících open-source systémů. Předtrénink modelu 30B spotřeboval přibližně 16 bilionů tokenů textových dat, přičemž velká část trénovacích dat pochází z indických jazyků.

Vedle textových modelů Sarvam vydal také model pro převod textu na řeč, model pro přepis řeči do textu a model pro analýzu dokumentů (vision). Tím kompletně pokrývá potřeby hlasových asistentů a podnikových aplikací zaměřených na indický trh.

Pro hlas, ne pro chatbotovou válku

Na rozdíl od OpenAI nebo Googlu Sarvam nemíří do bezplatné chatbotové války. Jeho spotřebitelská aplikace Indus AI (dostupná na webu, iOS a Androidu) slouží primárně ke sběru zpětné vazby a vylepšování modelů. „Nechceme být v závodě o to, kdo vypustí další bezplatný produkt," vysvětlil Kumar.

Hlavní zaměření firmy je B2B — podnikové a vládní nasazení. Sarvam už dnes dodává hlasové agenty pro zákaznickou podporu, jazykové technologie pro úřady a pilotní projekty s partnery jako finské HMD (Nokia) pro chytré telefony nebo Bosch pro automobilový průmysl. Platforma Samvaad umožňuje firmám stavět konverzační agenty podporující více než 10 indických jazyků.

India AI Mission: vláda jako partner

Sarvam AI je jedním z klíčových příjemců indické vládní iniciativy India AI Mission, která do rozvoje národní AI infrastruktury investuje miliardy dolarů. Trénink modelů Sarvam probíhal na výpočetních zdrojích poskytnutých v rámci této mise, s technickou podporou Nvidie a infrastrukturou od datového centra Yotta.

Indie se tak připojuje k trendu suverénní AI — snaze států budovat vlastní AI kapacity nezávisle na amerických nebo čínských gigantech. Podobné snahy vidíme v Evropě (projekt EuroHPC, AI Factory v Ostravě), Japonsku i na Blízkém východě.

Co to znamená pro Česko a Evropu

Příběh Sarvam AI je inspirací i pro evropskou scénu. Model Sarvam 30B je open-source (licenční podmínky zatím nebyly plně specifikovány, ale firma slibuje zveřejnění vah), což znamená, že si ho může stáhnout a spustit kdokoliv — včetně českých vývojářů a firem. Pro použití v češtině by však vyžadoval dodatečné dolaďování, protože primárně cílí na indické jazyky.

Přesto Sarvam dokazuje, že dominance Silicon Valley není neotřesitelná. Se čtyřiceti výzkumníky a zlomkem rozpočtu globálních gigantů lze postavit modely, které v určitých scénářích — zejména v hlasových a jazykově specifických aplikacích — mohou konkurovat modelům od OpenAI, Google nebo Anthropicu. Pro evropské startupy jako Mistral AI nebo české projekty typu AI Factory v Ostravě je to další důkaz, že cesta „dělat více s méně" je životaschopná.

Co bude dál

Sarvam aktuálně plánuje další investiční kolo pro rozšíření infrastruktury a týmů. Firma také připravuje specializované modely pro programování (Sarvam for Work) a rozšiřuje konverzační platformu Samvaad. Kumar označil dosavadní vývoj za „první směnu" — nyní přichází fáze monetizace a budování produktů pro reálné zákazníky.

„Nejde jen o Sarvam. Jde o hlad Indie dokázat, že na to má. Tohle je dekáda, kdy to musíme ukázat," uzavřel Kumar.

Je model Sarvam 105B dostupný zdarma?

Sarvam slíbil zveřejnit váhy modelů 30B i 105B jako open-source, nicméně přesné licenční podmínky a termín zveřejnění zatím nebyly upřesněny. Spotřebitelská aplikace Indus AI je v beta verzi dostupná zdarma, ale aktuálně pouze pro uživatele v Indii.

Podporuje Sarvam češtinu?

Primárně ne — modely Sarvam jsou trénovány převážně na indických jazycích (hindština, tamilština, telugština a dalších 10+ jazycích). Pro použití v češtině by bylo nutné model dodatečně doladit (fine-tuning) na českých datech, což je technicky možné, ale vyžaduje další výpočetní zdroje a kvalitní dataset.

V čem se Sarvam liší od DeepSeeku?

Oba sdílejí filozofii úsporného vývoje, ale přístup se liší. DeepSeek disponoval mnohem větším týmem (cca 5 000 výzkumníků) a masivnější výpočetní kapacitou, přesto dokázal dodat modely za zlomek nákladů americké konkurence. Sarvam jde ještě dál — se 40 lidmi postavil kompletní stack včetně hlasových a obrazových modelů, čímž ukazuje, že i menší hráči mohou být v AI závodě relevantní.

X

Nezmeškejte novinky!

Přihlaste se k odběru novinek a aktualit.