Přejít k hlavnímu obsahu

Anthropic testuje čipy Microsoftu: Claude míří za hranice Nvidie

Ilustrační obrázek pro jarvis-ai.cz
Anthropic, firma stojící za modelem Claude, jedná s Microsoftem o využití jeho vlastních AI čipů Maia pro provoz jazykových modelů Claude. Jde o další krok v rozbíjení monopolu Nvidie na trhu s AI hardwarem — a zároveň překvapivý moment: Anthropic je totiž silně finančně propojen s Amazonem a Googlem, přímými konkurenty Microsoftu v cloudu. Co za tím stojí a co to znamená pro trh s AI čipy?

Anthropic zkouší čipy Maia od Microsoftu: Hlavní konkurent OpenAI diverzifikuje hardware

Podle zpráv serverů The Information a CXO Digitalpulse vede Anthropic ranou fázi jednání s Microsoftem o využití jeho vlastních AI akcelerátorů z rodiny Maia. Konkrétně jde o čipy Maia 200, druhou generaci vlastního křemíku, který Microsoft vyvíjí pro svou cloudovou platformu Azure.

Na první pohled jde o překvapivý krok. Anthropic je totiž jedním z největších partnerů Amazonu — ten do firmy investoval už 8 miliard dolarů — a zároveň získal investici od Googlu ve výši 2 miliard dolarů. Obě firmy provozují vlastní cloudovou infrastrukturu a rovněž vyvíjejí vlastní AI čipy (AWS Trainium a Google TPU). Přesto se Anthropic obrací na Microsoft, jehož Azure je přímým konkurentem AWS i Google Cloudu.

Důvod je pragmatický: hlad po výpočetním výkonu. Claude, stejně jako konkurenční ChatGPT nebo Gemini, vyžaduje obrovské množství výpočetních zdrojů pro trénování i provoz (inferenci). Poptávka po čipech Nvidia — současném králi AI hardwaru — výrazně převyšuje nabídku a ceny šplhají do astronomických výšek. Každá H100 od Nvidie stojí 30–40 tisíc dolarů a dodací lhůty sahají až do řádu měsíců.

Co jsou čipy Microsoft Maia a proč na nich záleží

Microsoft představil první generaci vlastního AI čipu — Maia 100 — v listopadu 2023. Šlo o historicky první vlastní křemík, který firma navrhla pro cloudovou infrastrukturu Azure. Čip byl vyroben 5nm technologií v továrnách TSMC a obsahoval 105 miliard tranzistorů. Microsoft na něm od začátku spolupracoval s OpenAI, která jej testovala na svých modelech včetně GPT-3.5 Turbo.

Druhá generace — Maia 200 — byla oficiálně oznámena v roce 2025. Podle The Verge je Maia 200 optimalizována především pro inferenci — tedy provozování již natrénovaných modelů — kde je rychlejší a energeticky úspornější. V trénování nových modelů ale stále zaostává za Nvidií. To dává smysl: provoz modelů (kdy Claude odpovídá uživatelům) tvoří drtivou většinu výpočetní zátěže, zatímco trénink probíhá nárazově.

Pro Microsoft je případná spolupráce s Anthropicem strategicky zásadní. Firma do AI čipů investovala miliardy dolarů a potřebuje, aby je využíval někdo jiný než jen OpenAI — jinak by se její investice jen těžko vracela. Anthropic je v tomto ideální referenční zákazník: má špičkové modely, obrovskou uživatelskou základnu a jeho zátěž by Microsoftu poskytla cenná data pro další vývoj čipů.

Konec monopolu Nvidie? Na obzoru je pestřejší trh s AI čipy

Nvidia dnes ovládá zhruba 80–90 % trhu s AI akcelerátory. Její GPU jako H100 a novější B200 jsou de facto standardem pro trénování velkých jazykových modelů. Tento monopol ale vytváří zranitelnost: kdo nemá přístup k Nvidii, nemůže dělat špičkovou AI.

Anthropic není zdaleka jediný, kdo hledá alternativy:

  • Google vyvíjí vlastní TPU (Tensor Processing Unit) již od roku 2015 — aktuálně v šesté generaci. Používá je pro Gemini i pro zákazníky Google Cloudu.
  • Amazon investoval do čipů Trainium a Inferentia, které nabízí v rámci AWS jako levnější alternativu k Nvidii.
  • Meta vyvíjí vlastní MTIA (Meta Training and Inference Accelerator) pro své modely Llama.
  • OpenAI testuje čipy Maia od Microsoftu a údajně zvažuje i vývoj vlastního křemíku.

Přidání Anthropicu do seznamu firem, které diverzifikují svůj hardware, je významným signálem. Pokud by model Claude úspěšně běžel na čipech Maia, otevřelo by to dveře dalším AI firmám, které dosud spoléhaly výhradně na Nvidii.

Pro koncové uživatele by tato diverzifikace mohla znamenat nižší ceny AI služeb. Dnes platí provozovatelé modelů za výpočetní výkon astronomické částky, které se promítají do cen API přístupu i předplatného. Větší konkurence na trhu s hardwarem by tlačila ceny dolů — a to jak u enterprise řešení, tak u spotřebitelských produktů jako Claude Pro (20 USD měsíčně) nebo ChatGPT Plus.

Anthropic a jeho infrastrukturní hlad

Diverzifikace hardwaru u Anthropicu dává smysl i při pohledu na jeho celkovou infrastrukturní strategii. Firma nedávno uzavřela obří kontrakt se SpaceX na výpočetní kapacitu v hodnotě 15 miliard dolarů ročně, v rámci kterého využije superpočítač Colossus Elona Muska. Zároveň podle The Information Anthropic „stabilně zvyšuje využití Azure".

Jinými slovy: Anthropic nevsází na jednu kartu. Využívá kombinaci vlastních řešení, cloudových platforem (AWS, Google Cloud, Azure) a externích superpočítačů. Tento multi-cloudový a multi-hardwarový přístup je v AI průmyslu poměrně ojedinělý — většina firem se drží jedné platformy.

Co to znamená pro Evropu a Česko

Pro evropské a české firmy je tento trend důležitý ze dvou důvodů. Zaprvé Microsoft Azure má v Evropě silnou přítomnost — pokud by čipy Maia prokázaly svou efektivitu, mohly by se objevit i v evropských datových centrech Azure včetně regionu North Europe (Irsko) a West Europe (Nizozemsko). To by evropským firmám umožnilo provozovat AI modely na moderním hardwaru při dodržení GDPR.

Zadruhé jde o strategickou nezávislost. Evropská unie prostřednictvím European Chips Act investuje miliardy eur do budování vlastních kapacit pro výrobu čipů. Pokud se ukáže, že kvalitní AI akcelerátory mohou vznikat i mimo Nvidii, posiluje to argument pro evropské investice do polovodičového průmyslu.

Pro běžného uživatele v Česku se nic nemění okamžitě — Claude je nadále dostupný v češtině přes webové rozhraní i API, ať už běží na čipech od Nvidie, Microsoftu, nebo kohokoliv jiného. Důležitý je ale dlouhodobý dopad: pestřejší trh s hardwarem = nižší náklady = dostupnější AI služby pro všechny.

Jaký je rozdíl mezi trénováním a inferencí AI modelu?

Trénování je proces, při kterém se model „učí" na obrovském množství dat — trvá týdny až měsíce a spotřebuje obrovský výpočetní výkon. Inference je fáze, kdy už natrénovaný model odpovídá na dotazy uživatelů — probíhá neustále a tvoří většinu výpočetní zátěže v produkčním provozu. Čipy Maia 200 od Microsoftu jsou optimalizované primárně pro inferenci.

Proč Anthropic spolupracuje s Microsoftem, když ho financují Amazon a Google?

Investice od Amazonu a Googlu neznamenají exkluzivitu. Anthropic jako nezávislá firma hledá nejlepší poměr ceny a výkonu bez ohledu na dodavatele. Navíc poptávka po výpočetním výkonu je tak obrovská, že ani jeden dodavatel nestačí — Anthropic proto kombinuje kapacity od SpaceX, AWS, Google Cloudu a nyní potenciálně i Azure.

Ovlivní přechod na nové čipy kvalitu nebo rychlost odpovědí Claude?

Koncový uživatel by neměl poznat rozdíl. Pokud Anthropic úspěšně integruje čipy Maia, Claude poběží na jiném hardwaru, ale kvalita odpovědí zůstane stejná — model je definován svými parametry a tréninkem, nikoliv čipem, na kterém běží. V dlouhodobém horizontu by diverzifikace hardwaru mohla vést k nižším cenám a vyšší dostupnosti služby.

X

Nezmeškejte novinky!

Přihlaste se k odběru novinek a aktualit.