Dva čipy, jeden cíl: agentní éra
Dotykové displeje a cloudové služby změnily způsob, jakým pracujeme s technologiemi. Nyní stojíme na prahu dalšího přechodu: éry agentní AI, kdy modely nejen odpovídají na otázky, ale samostatně plánují, provádějí úkoly a učí se ze svých chyb v kontinuálních smyčkách. Taková práce klade na hardware zcela nové nároky — a právě na ně reaguje Google svou osmou generací Tensor Processing Unit.
TPU 8t a TPU 8i byly vyvinuty ve spolupráci s Google DeepMind a jsou optimalizovány pro nejnáročnější AI úlohy. „Klíčová myšlenka původního návrhu TPU platí i dnes: díky přizpůsobení a spoluvývoji silikonu s hardwarem, sítí a softwarem můžeme dosáhnout dramaticky vyšší energetické účinnosti i absolutního výkonu," vysvětluje Amin Vahdat, šéf technologů pro AI a infrastrukturu ve společnosti Google.
TPU 8t: superpočítač pro trénink
Trénink největších jazykových modelů je extrémně náročný proces, který může trvat měsíce. TPU 8t má tento cyklus zkrátit z měsíců na týdny. Nabízí téměř 3x vyšší výpočetní výkon na jeden pod než předchozí generace.
- Masivní škálování: Jeden superpod nyní obsahuje až 9 600 čipů a 2 petabajty sdílené vysokorychlostní paměti (HBM). Architektura poskytuje 121 exaflops výpočetního výkonu.
- Virgo Network: Nová síťová infrastruktura společně se softwarem JAX a Pathways umožňuje téměř lineární škálování až na milion čipů v jednom logickém clusteru.
- Spolehlivost: Systém cílí na více než 97 % „goodputu“ — tedy skutečně produktivního výpočetního času. Díky automatické detekci chyb a optickému přepínání obvodů (OCS) se hardware dokáže obejít bez lidského zásahu.
Pro firmy a výzkumné instituce to znamená, že mohou trénovat vlastní modely výrazně rychleji a spolehlivěji.
TPU 8i: inferenční mašina pro agentní workflow
Zatímco TPU 8t vládne tréninku, TPU 8i je specialista na inferenci — tedy skutečné spouštění modelů v produkci. V éře AI agentů, kdy spolu desítky či stovky agentů komunikují v reálném čase, je každá milisekunda drahá. I malá prodleva se při masivním nasazení násobí do značných výkonnostních ztrát.
- Přelomová paměť: Čip nabízí 288 GB vysokorychlostní paměti a 384 MB SRAM přímo na čipu — třikrát více než předchozí generace. To umožňuje udržet aktivní pracovní sadu modelu přímo na čipu a eliminovat „paměťovou zeď“.
- Boardfly architektura: Nová topologie snižuje maximální síťový průměr o více než 50 %, což zajišťuje, že systém funguje jako jednotná, nízkolatenční jednotka.
- Collectives Acceleration Engine (CAE): Tento nový engine na čipu snižuje latenci globálních operací až 5x.
Výsledkem je o 80 % lepší poměr výkonu k céně než u generace Ironwood. Firmy tak mohou obsloužit téměř dvojnásobek zákazníků při stejných nákladech.
Efektivita až po datové centrum
V dnešních datových centrech není limitujícím faktorem jen dodávka čipů, ale i elektrická energie. TPU 8t i TPU 8i nabízejí až 2x lepší výkon na watt než Ironwood. Google kromě toho integroval připojení k síti přímo na čip, což výrazně snižuje energetické náklady na přesun dat v rámci podu.
Obě platformy jsou chlazeny čtvrtou generací kapalinového chlazení, které umožňuje udržet výkon, při kterém by vzduchové chlazení selhalo. Google uvádí, že jeho datová centra dnes dodávají šestkrát více výpočetní síly na jednotku elektřiny než před pěti lety.
Co to znamená pro české firmy a vývojáře?
TPU 8t a 8i nejsou produkty pro běžné spotřebitele — jde o infrastrukturu dostupnou prostřednictvím Google Cloud. Pro české firmy, startupy a výzkumníky to znamená několik praktických věcí:
- Dostupnost: Čipy budou dostupné později v tomto roce jako součást Google AI Hypercomputer. České firmy s předplatným Google Cloud je mohou využívat stejně jako velké korporace.
- Podpora frameworků: TPU podporují JAX, PyTorch, SGLang i vLLM — tedy nástroje, které čeští vývojáři běžně používají.
- Evropský kontext: S rostoucím zájmem EU o digitální suverenitu a udržitelnost datových center mohou být energeticky úsporné TPU zajímavou alternativou k tradičním GPU clusterům. Google provozuje datová centra v Evropě a nabízí možnost regionálního ukládání dat v souladu s GDPR.
Alternativou zůstávají především GPU od Nvidie (H100, B200, případně novější Blackwell architektury), které dominují trhu s AI akcelerátory. Google však díky vlastním čipům nabízí hlubší optimalizaci napříč celým stackem — od silikonu přes software až po datové centrum.
Závěr: závod o infrastrukturu pokračuje
Osmá generace TPU není jen evoluční aktualizace specifikací. Rozdělení na tréninkový a inferenční čip reflektuje zralost AI trhu — vývojáři už nepotřebují jedno univerzální řešení, ale specializované nástroje pro konkrétní úlohy. Pokud Google skutečně dodrží slibovaný poměr ceny a výkonu, může TPU 8i zvlášť zatlačit na Nvidia v oblasti inferenčních datových center. Pro české firmy to znamená větší výběr cloudové infrastruktury a potenciálně nižší náklady na provoz vlastních AI aplikací.
FAQ
Jaký je rozdíl mezi TPU a běžnými GPU od Nvidie?
TPU (Tensor Processing Unit) jsou čipy navržené přímo Googlem speciálně pro výpočty s umělou inteligencí, zejména pro trénink a spouštění neuronových sítí. GPU (Graphics Processing Unit) jsou univerzálnější a původně vznikly pro grafiku, ale dnes se používají i pro AI. TPU nabízejí hlubší optimalizaci pro specifické AI úlohy a často lepší energetickou účinnost, zatímco GPU mají širší podporu ve všech typech aplikací.
Můžu si TPU 8t nebo 8i koupit do svého počítače?
Ne. TPU 8t a 8i jsou určeny výhradně pro datová centra a dostupné pouze jako cloudová služba přes Google Cloud. Pro vývojáře a studenty Google nabízí bezplatný přístup k menším TPU zdrojům například přes Google Colab, ale nejnovější generace bude dostupná až později v rámci komerčních nabídek.
Kdy přesně budou nové TPU dostupné v Evropě?
Google oznámil, že TPU 8t a 8i budou dostupné později v tomto roce. Přesné datum spuštění v konkrétních evropských regionech zatím nebylo upřesněno. Zájemci se mohou přihlásit k odběru informací přímo na stránkách Google Cloud.