DeepSeek V4: Bilion parametrů, rekordní kódování a cena, která mate konkurenci

3. 7. 2026 Daniel Česák

DeepSeek V4 je tu — a tentokrát Číňané nehrají na druhé housle. Nový model čínského startupu DeepSeek přichází ve dvou variantách: efektivní V4-Flash a výkonný V4-Pro s celkovými 1,6 bilionu parametrů. V testech programátorských schopností překonává Google Gemini i drtivou většinu konkurence, kontextové okno táhne až na milion tokenů a cena přístupu přes API je tak nízká, že vývojáři ve světě i v Česku si mnuli ruce. DeepSeek V4 nepřichází jako kuriozita ze zámoří — přichází jako reálná výzva dominanci OpenAI, Googlu a Anthropicu.

Co je DeepSeek V4 a proč je to jiné než předchozí modely

Čínský startup DeepSeek se na mapě světové AI zapsal před necelými dvěma lety jako tým, který dokáže dělat výjimečné věci s výrazně menšími zdroji, než mají technologičtí giganti ze Silikonového údolí. DeepSeek V4 je logickým vyvrcholením této filozofie — model, který na papíře vypadá jako kolosální stroj (celkem 1,6 bilionu parametrů), ale ve skutečnosti při každé odpovědi aktivuje jen zlomek z nich.

Za tím stojí architektura MoE (Mixture of Experts) — česky „směs expertů". Místo aby model zapojoval všechny parametry najednou, vybere si při každém dotazu jen tu část neuronové sítě, která je pro daný úkol nejrelevantnější. V praxi to znamená, že DeepSeek V4-Pro aktivuje při inferenci pouhých 49 miliard parametrů z celkového bilionového objemu. Výsledkem je výkon velkého modelu za cenu malého — a to je přesně ten trumf, který DeepSeek hraje.

Model přináší i technické inovace: novou hybridní attention architekturu kombinující CSA (Compressed Sparse Attention) a HCA (Heavily Compressed Attention), díky níž je práce s dlouhými kontexty o 73 % úspornější oproti předchůdci DeepSeek-V3.2. K tomu přichází optimalizátor Muon pro stabilnější trénink a mechanismus mHC (Manifold-Constrained Hyper-Connections) pro lepší přenos signálu napříč vrstvami modelu. Technický report byl zveřejněn na arXiv.org.

Dvě varianty: Flash pro rychlost, Pro pro výkon

DeepSeek V4 není jeden model, ale rodina:

DeepSeek-V4-Flash — 158 miliard parametrů, navržený pro rychlé odpovědi a každodenní úlohy. Aktivace jen části sítě z něj dělá jednu z nejúspornějších voleb na trhu.
DeepSeek-V4-Pro — 862 miliard aktivních parametrů (z celkových 1,6 bilionu), určený pro komplexní analýzy, složité kódování a vědecké úlohy.

Oba modely podporují kontextové okno o délce 1 milion tokenů — to odpovídá přibližně 750 000 slovům nebo celé knize. Maximální délka výstupu dosahuje 384 000 tokenů. Pro srovnání: GPT-4o zvládá 128 000 tokenů, Claude 3.5 Sonnet 200 000 tokenů.

Tři režimy přemýšlení: od rychlosti po maximum

Jednou z nejzajímavějších novinek DeepSeek V4 je systém tří režimů uvažování:

Non-Think — rychlé, intuitivní odpovědi bez hlubší analýzy. Vhodné pro rutinní otázky a rychlé vyhledávání.
Think High — zapojí logickou analýzu a vědomé uvažování. Skvělé pro komplexní problémy.
Think Max — maximální výkon. Model myslí déle, ale výsledky jsou výrazně lepší pro obtížné úlohy.

Rozdíl mezi režimy je měřitelný. Na benchmarku LiveCodeBench (testuje programování na reálných úlohách) dosahuje V4-Pro v Non-Think režimu 56,8 bodů, zatímco v Think Max skočí na 93,5 bodů. Na matematické olympiádě IMOAnswerBench je skok ještě dramatičtější: ze 35,3 na 89,8 bodů.

Benchmarky: kde DeepSeek V4 vede a kde zaostává

DeepSeek V4-Pro (v maximálním Think Max režimu) byl porovnán s nejlepšími modely na trhu — Claude Opus 4.6, GPT-5.4 a Google Gemini 3.1 Pro. Výsledky jsou překvapivé:

Programování — DeepSeek dominuje

Na LiveCodeBench dosahuje DeepSeek V4-Pro Max skóre 93,5, zatímco Gemini-3.1-Pro stojí na 91,7. Na soutěžním kódování Codeforces dosahuje rating 3206 — hodnota, která odpovídá mezinárodním mistrům v programování. Na benchmark SWE Verified, který testuje reálné opravy chyb v softwaru, dosahuje 80,6 %, a na BrowseComp (autonomní procházení webu) 83,4 %.

Znalosti a uvažování — konkurence místy vede

Na benchmarku GPQA Diamond (doktorátové otázky z fyziky, chemie, biologie) dosahuje DeepSeek 90,1 bodů — slušné číslo, ale Gemini-3.1-Pro vede s 94,3 a GPT-5.4 dosahuje 93,0. Na SimpleQA-Verified je situace podobná: DeepSeek 57,9 vs. Gemini 75,6.

Jinými slovy: v programování a agentních úlohách je DeepSeek V4 na špici nebo velmi blízko ní. Ve faktografických znalostech a vědeckém uvažování ho místy stále předstihují Gemini a GPT.

Cena: zlomek toho, co platíte jinde

A tady přichází to, co DeepSeek dělá DeepSeekem. Ceny přístupu přes API jsou agresivně nízké:

V4-Flash: vstup $0,14 / milion tokenů, výstup $0,28 / milion tokenů
V4-Pro: vstup $0,435 / milion tokenů, výstup $0,87 / milion tokenů

Pro srovnání: Claude Opus 4.6 stojí $15 za milion vstupních tokenů a $75 za milion výstupních. GPT-4o se pohybuje kolem $2,50 za vstup. DeepSeek V4-Pro je při běžném použití přibližně 3–17× levnější než srovnatelné modely ze Západu.

Webová verze na chat.deepseek.com je zdarma dostupná i z České republiky bez potřeby VPN.

Otevřený zdrojový kód: výhoda pro vývojáře v Česku i Evropě

DeepSeek V4 je open source pod licencí MIT — což je pro vývojářskou komunitu klíčové. Váhy modelu jsou volně dostupné na Hugging Face, kde si je ke dni vydání tohoto článku stáhlo přes 1,2 milionu uživatelů.

Díky tomu mohou firmy a vývojáři — včetně těch českých — provozovat DeepSeek V4 na vlastním hardwaru bez odesílání dat na externí servery. Pro GDPR compliance je to značná výhoda. Menší varianta V4-Flash (158B parametrů) je dostupná i pro organizace s omezeným hardware. Nasazení je možné přes frameworky vLLM nebo SGLang.

Czech startupy a výzkumné instituce, které hledají výkonný model bez vysokých nákladů na API a bez závislosti na amerických cloudy, mají nyní velmi konkrétní alternativu.

Dostupnost v češtině

DeepSeek V4 zvládá češtinu. Model byl trénován na vícejazyčných datech a pro faktické dotazy, překlady a programování funguje dobře. Kreativní psaní a idiomatické výrazy mohou být méně přirozené než u modelů trénovaných primárně na evropských datech, ale pro technické a analytické úlohy je čeština plně funkční.

Webová verze nemá českou lokalizaci rozhraní — komunikujete s modelem v češtině, ale menu a nastavení jsou v angličtině a čínštině.

Bezpečnost a GDPR: co zvažovat

Při použití veřejné webové verze platí standardní upozornění: data mohou být použita pro trénink modelu. Serverová infrastruktura DeepSeeku je čínská, což je v EU regulatorním prostředí citlivé téma — zejména po zavedení EU AI Act.

Pro firemní nasazení v Česku a EU je doporučenou cestou buď API s jasně definovanými podmínkami zpracování dat, nebo — a to je teprve skutečná svoboda — lokální nasazení open source vah na vlastním serveru.

Jaký je rozdíl mezi DeepSeek V4-Flash a V4-Pro?

V4-Flash je menší a rychlejší model s 158 miliardami parametrů, určený pro každodenní úlohy za nižší cenu (výstup $0,28 za milion tokenů). V4-Pro má celkem 1,6 bilionu parametrů a aktivuje při inferenci 49 miliard — je vhodný pro komplexní kódování, vědeckou analýzu a agentní úlohy (výstup $0,87 za milion tokenů). Oba modely podporují 1M tokenů kontext.

Mohu DeepSeek V4 používat zdarma z Česka?

Ano, webová verze na chat.deepseek.com je volně dostupná z České republiky bez VPN a bez poplatku. API přístup je zpoplatněný, ale výrazně levnější než konkurenční modely od OpenAI nebo Anthropicu. Vlastní nasazení open source vah je bezplatné, ale vyžaduje odpovídající hardware.

Je DeepSeek V4 bezpečný pro firemní použití v EU?

Pro firemní použití v EU je třeba opatrnosti při použití veřejné webové verze — data mohou být zpracovávána na čínských serverech. Bezpečnější variantou je nasazení open source modelu na vlastní infrastruktuře v EU, kde máte plnou kontrolu nad daty a splníte požadavky GDPR bez kompromisů.