Dva modely, jeden cíl: výkon za zlomek ceny
DeepSeek V4 nepřichází jako jediný model, ale jako rodina. V4-Pro je vlajková loď s 1,6 bilionem celkových parametrů, přičemž na každý token aktivuje 49 miliard. Je to největší open-source model současnosti. V4-Flash je jeho úspornější sourozenec: 284 miliard parametrů celkem, 13 miliard aktivních. Oba sdílejí kontextové okno 1 milion tokenů a vycházejí z architektury Mixture of Experts (MoE), která zpracovává jen zlomek vah naráz.
Pro české čtenáře je klíčové, že oba modely jsou zveřejněny pod MIT licencí. To znamená volnou komerční i nekomerční použitelnost, možnost vlastního hostování a úprav. Pro firmy v EU, které řeší dodržování GDPR a suverenitu dat, je to důležitá výhoda oproti uzavřeným modelům od OpenAI či Anthropic.
Architektura, která šetří paměť i peníze
Hlavní inovací V4 není jen velikost, ale efektivita. DeepSeek nahradil standardní pozornostní mechanismus tzv. Hybrid Attention Architecture kombinující Compressed Sparse Attention (CSA) a Heavily Compressed Attention (HCA). V praxi to znamená, že při milionovém kontextu potřebuje V4-Pro jen 27 % výpočetních operací a 10 % KV cache paměti oproti předchozímu V3.2.
Toto není marginální vylepšení. Milion tokenů odpovídá přibližně dvěma románům — nebo celému repozitáři zdrojového kódu. Dosud bylo tak dlouhé kontexty ekonomicky náročné nasadit. DeepSeek je díky kompresi a selektivní pozornosti činí dostupnými jako standardní funkci.
Kromě toho tým použil Muon optimizer místo běžného AdamW a zavedl tzv. Manifold-Constrained Hyper-Connections (mHC) pro stabilitu trénování při bilionových velikostech. Model prošel předtrénováním na 33 bilionech tokenů.
Benchmarky: nejlepší v kódu, mírný odstup ve znalostech
DeepSeek publikoval podrobné srovnání s nejlepšími uzavřenými modely. V programování dosahuje V4-Pro špičkových výsledků:
- LiveCodeBench: 93,5 % — nejvyšší skóre ze všech modelů (Claude Opus 4.6 má 88,8 %, Gemini 3.1 Pro 91,7 %)
- Codeforces rating: 3206 — nad GPT-5.4 (3168) i Gemini (3052)
- SWE-bench Verified: 80,6 % — téměř shodné s Claude Opus 4.6 (80,8 %)
V agentních úlohách, kde model samostatně pracuje v terminálu, získal V4-Pro na Terminal-Bench 2.0 67,9 % a překonal Claude (65,4 %). To je důležité pro vývojáře autonomních agentů.
Kde naopak ztrácí, jsou obecné znalosti a odborné multioborové dedukce. Na Humanity's Last Exam (HLE) dosáhl 37,7 %, zatímco Claude 40,0 % a Gemini 3.1 Pro 44,4 %. Na testu SimpleQA-Verified, který ověřuje přesnost faktografických odpovědí, má Gemini výrazný náskok. Pro čistě programátorské použití je to ale v zásadě bezvýznamné.
Ceník, který mění pravidla hry
Největší dopad může mít cena. DeepSeek opakuje recept z loňského R1: špičkový výkon za zlomek ceny konkurence.
| Model | Vstup / 1M tokenů | Výstup / 1M tokenů |
|---|---|---|
| DeepSeek V4-Flash | 0,14 USD | 0,28 USD |
| DeepSeek V4-Pro | 1,74 USD | 3,48 USD |
| Claude Opus 4.6 | 15 USD | 75 USD |
| GPT-5.4 | ~15 USD | ~60 USD |
V4-Pro je přibližně 21× levnější na výstupní tokeny než Claude Opus 4.6 při téměř totožném výkonu v programování. V4-Flash stojí méně než jeden cent na tisíc výstupních tokenů. Při přepočtu kurzem 23 Kč/USD vychází milion výstupních tokenů u V4-Pro na zhruba 80 Kč, u V4-Flash na necelých 6,50 Kč.
DeepSeek navíc nabízí zvýhodněné ceny pro cache hit — opakované systémové prompty — u V4-Pro jen 0,145 USD za milion vstupních tokenů. Pro agentní pipeline s opakujícími se úlohami to dále snižuje náklady.
Dostupnost a co to znamená pro české uživatele
Modely jsou dostupné třemi cestami: webové rozhraní chat.deepseek.com (Pro jako Expert Mode, Flash jako Instant Mode), API kompatibilní s OpenAI i Anthropic formátem, a jako otevřené váhy na Hugging Face.
Pro české vývojáře a firmy je zajímavá především možnost vlastního nasazení díky MIT licenci. V4-Flash má 160 GB, což je po kvantizaci dostupné i pro pokročilejší lokální hardware. V4-Pro s 865 GB je naopak určen pro cloudové clustery.
Na druhou stranu je třeba zmínit riziko: servery DeepSeek API běží v Číně. Pro firmy zpracovávající osobní údaje nebo citlivá data může být toto uspořádání v rozporu s interními bezpečnostními politikami nebo regulacemi. Self-hosting v rámci EU je proto pro citlivé aplikace jediná rozumná cesta.
Zajímavostí je, že DeepSeek V4 byl podle agentury Reuters trénován na čipech Huawei Ascend 950PR, nikoli na nejnovějším hardwaru NVIDIA. Potvrzuje to, že špičkové modely lze vyvíjet i mimo ekosystém amerického výrobce čipů.
Co V4 zatím neumí
Model je zatím ve fázi preview. DeepSeek přiznává, že na nejtěžších úlohách zůstává za uzavřenými modely zhruba 3–6 měsíců. Chybí mu také multimodální vstup — nezpracuje obrázky, zvuk ani video. Pro projekty, kde je nutná analýza screenshotů nebo dokumentů s grafy, je třeba sáhnout jinam.
Starší modely deepseek-chat a deepseek-reasoner budou vypnuty 24. července 2026, migrace na V4 je proto pro stávající uživatele nevyhnutelná.
Je DeepSeek V4 dostupný v češtině?
Oficiální webové rozhraní je v angličtině a čínštině. API ale podporuje český jazyk jako vstup i výstup na úrovni podobné jiným špičkovým modelům. Pro české firmy je největší výhodou možnost vlastního nasazení váh pod MIT licencí v rámci EU.
Jaký je rozdíl mezi V4-Pro a V4-Flash?
V4-Pro má 1,6 bilionu parametrů (49 miliard aktivních) a stojí 3,48 USD za milion výstupních tokenů. V4-Flash má 284 miliard parametrů (13 miliard aktivních) a stojí 0,28 USD za milion výstupních tokenů. Flash je ideální pro vysokofrekvenční úlohy, Pro pro nejsložitější programování a agentní workflow.
Mohu DeepSeek V4 provozovat lokálně v Evropě?
Ano, oba modely jsou pod MIT licencí a jejich váhy jsou volně ke stažení. V4-Flash (160 GB) je po kvantizaci dostupnější pro lokální nasazení. V4-Pro vyžaduje výkonné serverové clustery. Lokální provoz v EU řeší obavy z přenosu dat do Číny.