Přejít k hlavnímu obsahu

OpenAI a Broadcom představili Jalapeño: první vlastní AI čip pro rychlejší a levnější LLM

Ilustrační obrázek pro jarvis-ai.cz
OpenAI představilo svůj první vlastní čip pro umělou inteligenci. Jmenuje se Jalapeño, vznikl ve spolupráci s polovodičovým gigantem Broadcom a jde o přelomový krok v historii firmy, která dosud plně závisela na grafických kartách NVIDIA. Nový inferenční procesor slibuje přibližně o 50 % nižší náklady na zpracování dotazů a výrazně lepší energetickou účinnost — a to vše navrženého za pouhých devět měsíců.

Datum 24. června 2026 si výrobci a provozovatelé AI infrastruktury zaznamenají do diářů. OpenAI společně s Broadcomem představily čip Jalapeño — první vlastní inferenční procesor, který OpenAI kdy navrhlo. Nejde jen o technologickou kuriozitu: tato oznámení mají dalekosáhlé dopady na celý průmysl umělé inteligence, na ceny AI služeb i na dominantní pozici NVIDIA na trhu s AI hardware.

Co je Jalapeño a proč na něm záleží

Jalapeño je tzv. ASIC (Application-Specific Integrated Circuit) — čip navržený přímo na míru konkrétnímu úkolu, v tomto případě spouštění (inferenci) velkých jazykových modelů jako ChatGPT. Na rozdíl od NVIDIA GPU, které jsou výkonné univerzální procesory vhodné jak pro trénování modelů, tak pro jejich nasazení, je Jalapeño optimalizován výhradně pro inferenci — tedy pro moment, kdy model odpovídá na vaše dotazy.

Tento přístup není náhodný. Inference dnes tvoří největší část provozních nákladů OpenAI: každý dotaz uživatele do ChatGPT vyžaduje obrovský výpočetní výkon. Pokud dokáže vlastní čip tento výkon zajistit levněji a úsporněji, výsledek se projeví jak na provozní marži OpenAI, tak — v ideálním případě — na cenách pro uživatele.

Technické parametry: co víme

Broadcom a OpenAI zveřejnili základní technické parametry, byť řada detailů zůstává pod pokličkou:

  • Výrobní proces: TSMC 3nm — stejný uzel, na kterém vyrábí Apple své nejnovější čipy M4 nebo NVIDIA Blackwell
  • Architektura: systolická pole optimalizovaná pro maticové násobení, jádro výpočtů v LLM
  • Paměť: osm zásobníků HBM (High-Bandwidth Memory) přímo na pouzdru — extrémně rychlá paměť minimalizující latenci
  • Integrace: síťování zajišťují Broadcomovy čipy Tomahawk, montáž a rack integrace společnost Celestica
  • Rychlost vývoje: od první nákresy po tapeout (předání do výroby) jen 9 měsíců — podle Broadcomu jeden z nejrychlejších vývojových cyklů pro high-performance ASIC vůbec

Detailní specifikace — konkrétní výkon v TFLOPS, spotřeba energie, přesné rozměry čipu — zatím zveřejněny nebyly. Broadcom přislíbil podrobnější technické ověření do konce roku 2026. Stávající výsledky jsou interní benchmarky na předprodukčních vzorcích, které běží workloady GPT-5.3 Codex Spark.

O 50 % levnější inference: jak to myslí

Nejzajímavější tvrzení OpenAI je, že Jalapeño cílí na přibližně 50% snížení nákladů na jeden inferenční token oproti současným GPU clusterům. Token je základní jednotka zpracování textu — zhruba polovina slova v angličtině. Každý dotaz do ChatGPT stojí OpenAI určitý počet tokenů.

Jak toho chce Jalapeño dosáhnout? Systolická architektura minimalizuje zbytečné přesuny dat mezi pamětí a výpočetními jádry — právě to je u GPU největší zdroj energetické neefektivity při inferenci. Díky osmi zásobníkům HBM přímo na pouzdru navíc odpadají pomalé komunikační cesty přes vnější sběrnice.

Je ale nutné zdůraznit: tato čísla jsou zatím vlastní benchmarky OpenAI bez nezávislého ověření. Reálné výsledky se mohou lišit. Broadcom přislíbil zveřejnit podrobnější data ve druhé polovině roku 2026.

Microsoft kupuje 40 % produkce

Jedním z nejdůležitějších detailů oznámení je partnerství s Microsoftem. Ten se zavázal nakoupit přibližně 40 % první produkce čipů Jalapeño — což jednak pokryje část prvotních ekonomických rizik pro OpenAI, jednak potvrzuje, že Microsoft (do nějž investoval více než 13 miliard dolarů) bude první velký zákazník vlastní infrastruktury OpenAI.

Tento krok zapadá do širší strategie: Microsoft i OpenAI plánují budovat datová centra na úrovni jednoho gigawattu, tedy obřích zařízení pohlcujících výkon odpovídající malé elektrárně. V takových měřítkách je každé procento úspory obrovskou finanční položkou.

Největší hrozba pro NVIDIA?

Jalapeño je zatím inferenční čip — pro trénování modelů OpenAI nadále závisí na NVIDIA GPU, protože systolická pole se nehodí pro proměnlivé výpočetní nároky trénovacích workloadů. NVIDIA tedy o svoji dominantní pozici v nejdražší části AI byznysu zatím nepřijde.

Nicméně inference je obrovský a rychle rostoucí segment. Právě zde se dnes odehrává naprostá většina "každodenního" provozu AI: každý dotaz uživatele do ChatGPT, Claude, Gemini nebo Copilotu. Pokud OpenAI skutečně dosáhne 50% úspory, CNBC odhaduje, že to může přesměrovat miliardové zakázky od NVIDIA k Broadcomu a vlastní infrastruktuře.

OpenAI se tím zařazuje po bok Googlu (čipy TPU), Amazonu (Trainium/Inferentia) a Applu (vlastní silikon), kteří si rovněž budují nezávislost na NVIDIA. Zároveň to potvrzuje trend: největší spotřebitelé AI výkonu chtějí hardware ušitý na míru svým modelům, nikoli koupit drahé GPU a doufat v nejlepší.

Devět měsíců: proč je to rekord

Vývoj výkonného ASIC normálně trvá dva až čtyři roky. OpenAI a Broadcom zvládli cestu od návrhu po tapeout za devět měsíců — a přiznávají, že tohoto tempa dosáhli i díky vlastním AI modelům, které pomáhaly s částmi návrhu a optimalizace čipu. Jde o pěkný příklad toho, jak AI urychluje vývoj samotných AI systémů.

Do konce roku 2026 má proběhnout první prototypové nasazení Jalapeño v produkčním prostředí. Plná výrobní rampa, kdy čipy nahradí větší část GPU infrastruktury, je plánována na roky 2027–2028.

Co to znamená pro českého uživatele ChatGPT

Jalapeño není produkt, který si koupíte nebo stáhnete. Jde o infrastrukturní komponentu, která bude pracovat v pozadí — a jejíž efekty uživatelé pocítí nepřímo. Pokud sliby o 50% snížení nákladů vyjdou, lze do budoucna očekávat:

  • Rychlejší odpovědi ChatGPT i při špičkové zátěži
  • Nižší latenci u real-time aplikací (voice mode, coding assistants)
  • Potenciálně levnější API přístupy pro vývojáře a firmy
  • Větší kapacitu pro rozšíření free tierů

ChatGPT je dostupný v češtině a čeští uživatelé ho využívají ve stovkách tisíc. Jakékoli zlevnění provozních nákladů OpenAI se v principu může promítnout do přístupnějších cen i pro tuzemský trh — byť přímé cenové garance zatím nepadly.

Z pohledu EU a českého regulatorního prostředí jde Jalapeño v logice AI Act: vlastní hardware znamená větší kontrolu nad infrastrukturou, snazší auditovatelnost a menší závislost na třetích stranách — což regulátoři vítají.

Shrnutí: začátek nové éry AI hardwaru

Jalapeño není ani první ani poslední vlastní AI čip od velkých technologických hráčů. Je ale historicky prvním čipem OpenAI a jasným signálem, že firma se mění z softwarové laboratoře na integrovaný technologický ekosystém. Kombinace vlastních modelů, vlastního hardwaru a gigawattových datových center v partnerství s Microsoftem skládá puzzle vertikálně integrované AI továrny — podobně jako to dělá Google nebo Amazon.

Otázka není, zda Jalapeño změní AI průmysl. Spíše: jak rychle a do jaké míry se slíbené zisky v efektivitě ukážou jako reálné, až začnou čipy v produkci běžet workloady pro stamiliony uživatelů denně.

Nahradí Jalapeño NVIDIA GPU v datacentrech OpenAI úplně?

Ne — přinejmenším ne v dohledné době. Jalapeño je inferenční čip optimalizovaný pro spouštění hotových modelů. Trénování nových modelů (jako GPT-5 nebo dalších generací) zůstane závislé na NVIDIA GPU, protože systolická architektura Jalapeño se nehodí pro proměnlivé výpočetní vzory tréninku. OpenAI plánuje hybridní přístup: vlastní čipy pro inference, NVIDIA pro trénování.

Kdo jiný si může Jalapeño koupit — třeba evropské firmy nebo výzkumné instituce?

Jalapeño není komerční produkt určený k prodeji třetím stranám. Jde o proprietární hardware výhradně pro infrastrukturu OpenAI, přičemž Microsoft se zavázal odebrat přibližně 40 % první produkce pro své Azure datová centra. Evropské firmy a výzkumné instituce tedy k čipu přímý přístup nemají — mohou ho využívat nepřímo skrze API ChatGPT nebo Azure OpenAI Service.

Proč si OpenAI nenechalo čip vyrobit od NVIDIA místo Broadcomu?

NVIDIA nevyrábí čipy na zakázku pro konkurenty — nabízí pouze vlastní produkty (H100, H200, Blackwell). Broadcom je naopak přední návrhář zakázkových ASIC čipů a pracuje podobně i pro Google (TPU), Meta a další. OpenAI si volbou Broadcomu zachovává vlastnictví architektury a designu čipu, zatímco Broadcom zajišťuje implementaci v křemíku. Výroba samotná pak probíhá u TSMC na procesu 3nm.

X

Nezmeškejte novinky!

Přihlaste se k odběru novinek a aktualit.