Mini DeepSeek V4 Flash: Čínský model za haléře konkuruje GPT-5.5 i Claude Opus

3. 7. 2026 Daniel Česák

Čínský DeepSeek změnil pravidla hry. Jeho nejnovější modelová řada V4 — a především „mini“ varianta V4 Flash — nabízí výkon srovnatelný s modely od OpenAI a Anthropicu za cenu, která je až 107× nižší. Zatímco západní laboratoře zdražují a zavádějí limity, DeepSeek sází na dostupnost. A americké firmy to začínají ve velkém využívat.

DeepSeek V4 Flash: Malý model, velké ambice

DeepSeek na konci dubna 2026 zveřejnil preview dvou modelů nové generace — DeepSeek V4 Pro a DeepSeek V4 Flash. Oba jsou postavené na architektuře Mixture of Experts (MoE), která aktivuje jen část parametrů pro každý dotaz, čímž dramaticky snižuje provozní náklady. Zatímco V4 Pro je vlajkovou lodí s 1,6 bilionu parametrů (49 miliard aktivních), právě V4 Flash vzbudil největší pozornost — má 284 miliard celkových parametrů, ale jen 13 miliard aktivních, a přesto se výkonem blíží modelům, které stojí desítkykrát víc.

Oba modely zvládají kontextové okno 1 milion tokenů — to je zhruba 750 000 slov, tedy ekvivalent celé trilogie Pána prstenů. Pro vývojáře to znamená možnost vložit celý kódový repozitář nebo rozsáhlou dokumentaci do jednoho promptu.

Cenový šok: Kolik stojí jednotlivé modely

Největší zbraň DeepSeeku není výkon, ale cena. Podívejme se na srovnání cen za milion tokenů (vstup/výstup):

DeepSeek V4 Flash: $0,14 / $0,28
DeepSeek V4 Pro: $1,74 / $3,48
GPT-5.5: $5 / $30
Claude Opus 4.7: $5 / $25
Claude Sonnet 4.6: $3 / $15
Gemini 3.1 Pro: $5 / $25

V praxi to znamená, že V4 Flash je 35× levnější na vstupu a 107× levnější na výstupu než GPT-5.5 od OpenAI. Pro firmu, která měsíčně protáhne modely desítky milionů tokenů, se rozdíl počítá ve stovkách až tisících dolarů měsíčně. Není divu, že podle dat společnosti Ramp se DeepSeek v červnu 2026 stal nejrychleji rostoucím softwarovým dodavatelem mezi americkými firmami.

Jak si V4 Flash stojí v benchmarcích

DeepSeek sám přiznává, že V4 Pro zaostává za nejlepšími západními modely o 3 až 6 měsíců — konkrétně za GPT-5.4 a Gemini 3.1 Pro v testech znalostí. V programovacích benchmarcích jsou ale oba V4 modely „srovnatelné s GPT-5.4". Na benchmarku GDPval-AA od Artificial Analysis dosáhl V4 Pro 1 554 Elo bodů, což je skok o 355 bodů oproti předchozí V3.2.

Flash varianta přitom není designovaná jako „odlehčená" verze, ale jako samostatný model optimalizovaný pro agentní úlohy — tedy pro autonomní AI agenty, kteří samostatně plní úkoly, vyhledávají informace nebo pracují s kódem. DeepSeek uvádí, že V4 modely jsou integrovány s nástroji jako Claude Code, OpenClaw a OpenCode a používají se interně pro agentní programování.

Technická magie: Jak DeepSeek dosáhl takové efektivity

Klíčovou inovací je nová hybridní attention architektura, která kombinuje kompresi tokenů s takzvanou „řídkou pozorností" (sparse attention). Výsledek? Podle technické zprávy potřebuje V4 Pro při zpracování milionu tokenů jen 27 % výpočetního výkonu a 10 % KV cache paměti oproti starší V3.2. Flash verze jde ještě dál — 10 % výpočtů a 7 % cache.

V překladu: DeepSeek dokázal, že i obrovské kontexty se dají zpracovávat s minimální režií. To je zásadní pro agentní AI, která často musí udržovat dlouhé konverzační historie nebo pracovat s rozsáhlými datovými sadami.

Modely byly trénovány na až 33 bilionech tokenů s důrazem na vícejazyčná data, vědecké publikace a agentní scénáře. DeepSeek v technické zprávě výslovně uvádí, že při post-tréninku používá destilaci z vlastních specializovaných modelů — učitelů na matematiku, kód, agenty a následování instrukcí. Obvinění z destilace z GPT či Claude, která vůči DeepSeeku vznesly Anthropic i OpenAI, se v technické zprávě nepotvrzují — ale ani výslovně nevyvracejí.

Čínská cenová válka: DeepSeek, Xiaomi a Alibaba tlačí ceny dolů

DeepSeek není jediný čínský hráč, který tlačí ceny AI na minimum. V květnu 2026 firma oznámila, že 75% slevu na model V4 Pro činí trvalou — výstupní tokeny tak stojí minimálně 34× méně než u GPT-5.5. Xiaomi s modelem MiMo mezitím zlevnilo API o 99 % a Alibaba s Qwen3.6-27B poráží GPT i Gemini v programovacích benchmarcích za zlomek ceny. Objevují se i menší hráči — čínský Z.ai s modelem GLM-5.2, který překonává GPT-5.5 v programování za šestinovou cenu.

Tahle cenová válka má dopad i na západní firmy. OpenAI přiznalo, že současné ceny nejsou dlouhodobě udržitelné, a zavedlo nižší tarif ChatGPT Go za 120 Kč měsíčně. Microsoft údajně omezuje používání Claude Code ve firmě kvůli rostoucím nákladům. A Uber podle zpráv vyčerpal svůj roční rozpočet na AI nástroje za pouhé čtyři měsíce.

Co to znamená pro Česko a Evropu

Pro české firmy a vývojáře je DeepSeek V4 Flash mimořádně zajímavou alternativou. Model je k dispozici jako open-weight pod MIT licencí — to znamená, že si ho můžete zdarma stáhnout, spustit na vlastní infrastruktuře a dokonce komerčně využívat. Pro startup nebo střední firmu, která nechce platit stovky dolarů měsíčně za API od OpenAI nebo Anthropicu, je to atraktivní cesta.

DeepSeek API je dostupné přes rozhraní kompatibilní s OpenAI i Anthropic formátem, takže přechod z ChatGPT nebo Claude nevyžaduje zásadní přepisování kódu. Model podporuje češtinu — i když primárně cílí na angličtinu a čínštinu, vícejazyčný trénink na 33 bilionech tokenů zahrnuje i slovanské jazyky.

Je tu ale i stinná stránka. Data posílaná do API DeepSeeku putují na čínské servery, což s sebou nese bezpečnostní a právní rizika, zejména ve světle GDPR a chystaného EU AI Act. Pokud firma zpracovává citlivá data, je rozumnější provozovat model lokálně nebo přes evropské inference providery (například Fireworks AI nebo DeepInfra), kteří V4 modely také nabízejí.

DeepSeek na vzestupu: Americké firmy si vybírají levnější AI

Data z platební platformy Ramp, která sleduje transakce více než 50 000 amerických firem, ukazují, že DeepSeek v červnu 2026 vedl kategorii „trending" — tedy dodavatelů s největším relativním růstem. Není to poprvé, co čínské modely zaznamenaly masivní adopci: už v prosinci 2025 čínské modely poprvé předstihly americké v počtu stažení na Hugging Face, kde tvořily přes 44 % všech downloadů populárních nových modelů.

Hlavní ekonom Rampu Ara Kharazian ale varuje: „Americké firmy platí DeepSeeku přímo a posílají mu svá data. To není o výhodách open-source." Zároveň pochybuje, že tento trend vydrží — zejména pokud se přiostří regulatorní tlak mezi USA a Čínou.

A ten už přiostřuje. USA v dubnu 2026 obvinily Čínu z průmyslové krádeže duševního vlastnictví amerických AI laboratoří. Kontext je důležitý i pro evropské firmy: zatímco dnes je DeepSeek volně dostupný, geopolitické napětí může kdykoliv změnit pravidla hry — od blokace API až po zákaz používání čínských modelů v určitých sektorech.

Je DeepSeek V4 Flash skutečně zdarma?

Ano i ne. Model je open-weight pod MIT licencí — můžete si ho zdarma stáhnout a provozovat na vlastním hardwaru. Pokud ale používáte API přes servery DeepSeeku, platíte za tokeny — byť řádově méně než u OpenAI nebo Anthropicu. V4 Flash stojí $0,14 za milion vstupních tokenů a $0,28 za milion výstupních tokenů.

Zvládne DeepSeek V4 Flash češtinu?

Ano, díky tréninku na 33 bilionech tokenů s důrazem na vícejazyčnost model češtinu podporuje. Není ale tak silný ve slovanských jazycích jako v angličtině a čínštině — zejména u odborných nebo právních textů může občas chybovat.

Může DeepSeek V4 Flash nahradit ChatGPT nebo Claude?

Pro většinu běžných úloh — generování textu, překlady, základní programování, analýzu dat — ano, a to za zlomek ceny. V nejnáročnějších úlohách (špičkové programování, specializované právní nebo medicínské texty) ale stále zaostává za GPT-5.5 a Claude Opus 4.7. Sám DeepSeek přiznává zpoždění 3–6 měsíců za nejlepšími modely.