Přejít k hlavnímu obsahu

DeepSeek-V4 Preview: Open-source model s milionovým kontextem a cenou, která drtí konkurenci

Ilustrační obrázek pro jarvis-ai.cz
Čínská společnost DeepSeek představila 24. dubna 2026 preview verzi svého nejvýkonnějšího jazykového modelu DeepSeek-V4. Novinka nabízí kontextové okno až jeden milion tokenů, open-source licenci MIT a cenu API, která podle dostupných údajů činí zlomek toho, co účtují američtí rivalové. Zároveň model výrazně posiluje schopnosti v oblasti agentního kódování, matematiky a práce s dlouhými dokumenty.

Co přináší DeepSeek-V4

DeepSeek-V4 přichází ve dvou hlavních variantách. DeepSeek-V4-Pro disponuje 1,6 bilionem celkových parametrů, přičemž aktivních je vždy 49 miliard. Díky architektuře Mixture-of-Experts (MoE) se tak při inferenci aktivuje pouze zlomek neuronové sítě, což dramaticky snižuje nároky na výpočetní výkon i cenu. DeepSeek-V4-Flash je pak lehčí verze s 284 miliardami parametrů a 13 miliardami aktivních, určená pro rychlé a ekonomicky nenáročné úlohy.

Obě varianty podporují kontextové okno až jeden milion tokenů a maximální délku výstupu 384 000 tokenů. To v praxi znamená, že model dokáže najednou zpracovat například několik dlouhých knih, rozsáhlé právní smlouvy nebo kompletní zdrojové kódy velkých softwarových projektů. Pro srovnání: nejnovější modely od OpenAI či Anthropic obvykle nabízejí kontext v řádu stovek tisíc tokenů, přičemž přístup k milionovým kontextům bývá často limitovaný nebo dražší.

Technické inovace pod kapotou

Klíčovým prvkem efektivity je Hybrid Attention Architecture, která kombinuje Compressed Sparse Attention (CSA) a Heavily Compressed Attention (HCA). Díky tomu DeepSeek-V4-Pro při zpracování milionového kontextu spotřebuje pouze 27 % výpočetních operací (FLOPs) a 10 % KV cache oproti předchozí generaci DeepSeek-V3.2. To umožňuje provozovat extrémně dlouhé kontexty na běžném hardwaru, což je zásadní zejména pro firmy a vývojáře, kteří si model hostují lokálně.

Další novinkou je optimalizátor Muon, který urychluje konvergenci tréninku a zlepšuje stabilitu modelu. DeepSeek také implementoval Manifold-Constrained Hyper-Connections (mHC) — pokročilé reziduální spojení, která dále zvyšují přesnost při přenosu informací napříč vrstvami neuronové sítě.

Jak si vede v benchmarkech

DeepSeek-V4-Pro se v testech zaměřených na výkon umělé inteligence umístil na špičce open-source kategorie a v některých disciplínách překonal i uzavřené komerční modely. Na benchmarku LiveCodeBench dosáhl skóre 93,5 %, což jej řadí před Gemini-3.1-Pro (91,7 %) i konkurenční systémy. V programátorské soutěži Codeforces model dosáhl ratingu 3206, což představuje úroveň špičkových lidských programátorů.

V oblasti matematiky a přírodních věd (benchmark GPQA Diamond) dosáhl model 90,1 %, což je srovnatelné s nejlepšími systémy na trhu, i když mírně zaostává za Gemini-3.1-Pro (94,3 %) a GPT-5.4 (93,0 %). V testu obecné znalosti MMLU-Pro model získal 87,5 %. V testu dlouhodobé paměti MRCR 1M (Million-Token Context Retrieval) si V4-Pro vedl s 83,5 % výrazně lépe než Gemini-3.1-Pro (76,3 %), což potvrzuje dominantní pozici v práci s extrémně dlouhými texty.

Simon Willison, renomovaný vývojář a analytik AI, ve svém komentáři k vydání poznamenal, že DeepSeek-V4 nabízí „téměř špičkový výkon za zlomek ceny“. Podle jeho analýzy model zaostává za nejmodernějšími uzavřenými systémy přibližně o 3–6 měsíců, což je vzhledem k cenovému rozdílu pro mnoho aplikací akceptovatelné.

Cena API: Desetkrát levněji než u konkurence

Jednou z největších výhod DeepSeek-V4 je cena. Za vstupní tokeny u varianty Flash zaplatí vývojáři 0,14 dolaru za milion tokenů, u Pro varianty pak 1,74 dolaru za milion. Výstupní tokeny stojí 0,28 dolaru (Flash), respektive 3,48 dolaru (Pro). Při srovnání s konkurencí je to dramatický rozdíl: GPT-5.4 stojí 2,50 dolaru za vstup a 15 dolarů za výstup, Claude Opus 4.7 dokonce 5 a 25 dolarů. I levnější Gemini 3.1 Pro přijde na 2 dolarů za vstup a 12 dolarů za výstup.

DeepSeek-V4-Pro je tak při výstupních tokenech čtyřikrát levnější než Gemini 3.1 Pro a více než čtyřikrát levnější než GPT-5.4. Flash varianta je pak extrémně dostupná i pro hobby projekty a studenty. Navíc DeepSeek nabízí slevu 80–90 % v případě, že se tokeny načtou z cache, což při opakovaných dotazech ještě více snižuje náklady.

Pro české firmy a startupy to znamená, že mohou nasadit špičkový jazykový model za náklady, které byly ještě před rokem nemyslitelné. Při současném kurzu činí cena za milion vstupních tokenů u Flash varianty přibližně 3,20 Kč, u Pro varianty pak zhruba 40 Kč. Pro srovnání: GPT-5.4 přijde na více než 57 Kč za vstup a 343 Kč za výstup.

Agentní schopnosti a kompatibilita

DeepSeek-V4 byl od základu navržen pro práci v agentním režimu — tedy pro autonomní plnění složitých úkolů. Společnost optimalizovala model pro kompatibilitu s populárními vývojářskými nástroji, včetně Claude Code, OpenClaw, OpenCode a CodeBuddy. Díky tomu mohou vývojáři snadno integrovat DeepSeek-V4 do svých stávajících workflow bez nutnosti měnit celou infrastrukturu.

API DeepSeek podporuje formáty kompatibilní s OpenAI i Anthropic API. Pro přechod od konkurence tak stačí změnit základní URL adresu na https://api.deepseek.com nebo https://api.deepseek.com/anthropic. To výrazně snižuje přepážkové náklady při migraci existujících aplikací.

Model nabízí tři režimy reasoningu: Non-think pro rychlé intuitivní odpovědi, Think High pro logickou analýzu a Think Max pro maximální přesnost při řešení komplexních problémů. Poslední zmíněný režim vyžaduje kontext alespoň 384 000 tokenů a je určen pro nejnáročnější úlohy.

Jak jej využít v Česku

DeepSeek-V4 je dostupný globálně, včetně České republiky. Uživatelé mohou model vyzkoušet přímo na chat.deepseek.com nebo v mobilní aplikaci pro iOS a Android, která je ke stažení v českých obchodech. Webové rozhraní a aplikace jsou však aktuálně pouze v angličtině a čínštině — česká lokalizace rozhraní zatím není k dispozici. Samotný model češtinu podporuje jako jeden z mnoha jazyků, přičemž kvalita generování v češtině je srovnatelná s jinými top modely.

Pro vývojáře je k dispozici API na api.deepseek.com, kde lze platit běžnou platební kartou. Díky kompatibilitě s OpenAI SDK mohou české firmy snadno přepnout stávající integrace z ChatGPT na DeepSeek-V4 jen změnou několika řádků kódu.

Vzhledem k MIT licenci si mohou firmy a instituce stáhnout modelové váhy z Hugging Face a provozovat model plně lokálně. To je zvláště zajímavé pro organizace zabývající se citlivými daty — například banky, pojišťovny nebo státní instituce, které musí dodržovat GDPR a evropské regulace. Lokalizovaný provoz eliminuje riziko přenosu dat mimo EU.

Modelové váhy mají však značnou velikost: V4-Pro zabere 865 GB, Flash varianta 160 GB. Pro plnohodnotný provoz Pro varianty tak bude nutné investovat do výkonných serverů s dostatečnou kapacitou GPU. Flash varianta je přístupnější a dá se provozovat i na menších clusterů.

Co to znamená pro trh s AI

Vydání DeepSeek-V4 dále posiluje pozici čínského výrobce jako jednoho z klíčových hráčů globálního AI trhu. Společnost, založená v roce 2023 Liang Wenfengem a financovaná hedgeovým fondem High-Flyer, už dříve šokovala trh modelem DeepSeek-R1, který konkuroval GPT-4 za zlomek ceny. S V4 nyní DeepSeek útočí na úplnou špičku.

Pro evropský trh je to dobře. Existence silného open-source konkurenta tlačí na snižování cen u uzavřených modelů a zároveň nabízí firmám nezávislost na amerických dodavatelích. V kontextu připravovaných evropských regulací, včetně AI Act, mohou open-source modely s transparentní architekturou usnadnit compliance a audit algoritmických rozhodnutí.

DeepSeek však čelí i otázkám ohledně původu tréninkových dat a možné cenzury citlivých politických témat. Uživatelé by měli být při nasazování modelu v produkčním prostředí obezřetní a ověřovat si kvalitu výstupů v kontextu svých konkrétních úloh.

Je DeepSeek-V4 zdarma pro běžné uživatele?

Ano, webové rozhraní na chat.deepseek.com a mobilní aplikace jsou pro koncové uživatele zdarma. Poplatky se účtují až při použití API pro vývojářské účely, kde se platí za objem zpracovaných tokenů.

Můžu DeepSeek-V4 provozovat na vlastním serveru v ČR?

Ano, model je k dispozici pod MIT licencí, takže si jej můžete stáhnout z Hugging Face a provozovat lokálně. Pro variantu V4-Pro však budete potřebovat server s kapacitou přes 865 GB a výkonnými GPU. Levnější varianta Flash zabere 160 GB a je dostupnější pro menší infrastrukturu.

Jak je to s českým jazykem a GDPR při používání DeepSeek-V4?

Model češtinu podporuje a generuje text v kvalitě srovnatelné s konkurencí. Pokud ale potřebujete zpracovávat osobní údaje v souladu s GDPR, doporučujeme buď lokální provoz modelu, nebo důkladné posouzení přenosu dat přes API. DeepSeek je čínská společnost a její servery nemusí podléhat evropskému právnímu řádu.