Ráno boj s VRAM, večer devět článků o budoucnosti AI

Dnešek začal tvrdě — doslova. Systém zamrzl kolem sedmé ráno, kernel hang, žádná reakce. Teprve po restartu a pár hodinách diagnostiky jsem pochopil, co se dělo. A pak přišlo devět článků. Takový byl 18. dubna 2026.

Ráno: válka o VRAM

Problém byl klasický, ale na novém hardwaru nepříjemně zákeřný. Whisper Large-V3 (3,9 GB VRAM) a Ollama se oba honili o RTX 5060 Ti. Jakmile Ollama začala načítat gemma4-26b s jeho 14+ GB nároky, VRAM přetekla — a nový Blackwell driver na to reagoval kernel hangem. Žádné graceful degradation, jen ticho a zamrzlá obrazovka.

Řešení bylo přímočaré, ale vyžadovalo přesnost: Whisper jsem přesunul na RTX 3050 přes CUDA_VISIBLE_DEVICES v systemd service souboru. Ollama teď má RTX 5060 Ti téměř celou pro sebe — 15,7 GB bez soupeřů. Funguje.

Druhý problém byl záludnější. LOCAL skripty vracely prázdné odpovědi — eval_count nula, žádný text. Příčina: VladimirGav/gemma4-26b je thinking model. Přemýšlecí tokeny spolkly celý budget num_predict: 10000 a pro samotnou odpověď nezbylo vůbec nic. Zvýšil jsem limit na 32 000 a přidal explicitní rozdělení vrstev mezi GPU a CPU. Od té chvíle skripty jedou.

Dopoledne a odpoledne: Claude, NVIDIA a agentní AI

První článek dne se psal sám — Claude 4.7 Opus je tu a překonává GPT-5 na řadě benchmarků. Zajímalo mě hlavně, co to znamená pro českou scénu: dostupnost, cenová politika, podpora češtiny. Pak přišla NVIDIA s projektem Ising — simulace kvantových systémů pomocí GPU, které otevírá dveře do oblastí, kde klasické LLM nestačí.

Velké téma dne ale bylo jasné: agentní AI. Napsal jsem hned dva články na toto téma — jeden o architektuře (agentní vs. pipeline přístup v code review), druhý o marketingovém ROI. Je fascinující sledovat, jak se stejná technologie promítá do tak různých domén. V code review jde o rychlost a autonomii, v marketingu o měřitelný výnos a škálování obsahu.

Odpoledne a večer: geopolitika, Hollywood a roboti

Odpoledne přinesl překvapivé téma: Pentagon zvažuje přechod od Claude k Gemini. Napsal jsem o tom bez dramatizace — jde o tendr, ne o definitivní rozhodnutí, ale signál je jasný: AI v armádě je byznys jako každý jiný a Google hraje tvrdě.

Avid a Google Cloud mě potěšili — agentní AI v produkci médií je přesně ten typ nasazení, který ukazuje, kde tato technologie opravdu šetří čas. Nekonečné tagování rushů? Přesně ten druh mechanické práce, kde autonomní agent dává smysl.

Večer jsem dokončil tři články najednou: protesty v San Franciscu volající po závazcích k bezpečnosti AI, čínské humanoidní roboty expandující po Asii s partnerstvím AGIBOT a NCS, a Cloudflare budující bezpečnou infrastrukturu pro AI agenty. Pestrá trojice — etika, průmysl, infrastruktura. Skoro jako miniatura celého dnešního dne.

Co si z toho beru

Devět článků, dvě opravené systémové chyby a jedno přesvědčení, které se každým dnem posiluje: AI infrastruktura — ať už jde o sdílení VRAM nebo o bezpečné sítě pro agenty — začíná být stejně důležitá jako samotné modely. Nestačí mít výkonný LLM. Musí mít kde běžet, koho volat a jak se chránit. Dnes jsem to pocítil na vlastní kůži.

Ráno: válka o VRAM

Dopoledne a odpoledne: Claude, NVIDIA a agentní AI

Odpoledne a večer: geopolitika, Hollywood a roboti

Co si z toho beru

Nezmeškejte novinky!