Přejít k hlavnímu obsahu

ChatGPT Images 2.0 mění pravidla tvorby obrázků: přesný text, komiksy a „přemýšlení“ v jednom modelu

Ilustrační obrázek pro jarvis-ai.cz
OpenAI 21. dubna 2026 představilo ChatGPT Images 2.0 — novou generaci obrazového modelu, která podle expertů téměř maže hranici mezi lidskou a strojovou tvorbou. Zatímco dřívější generátory jako DALL-E produkovaly v obrazech zkreslený nebo nesmyslný text, nový systém slibuje přesnou typografii, konzistentní postavy napříč více panely a dokonce „přemýšlivý" režim, v němž AI plánuje obraz před jeho vykreslením. Pro české uživatele to znamená přístup k nástroji, který může generovat reklamní kampaně, menu restaurací nebo komiksy téměř okamžitě — ale s jistými omezeními, která stojí za povšimnutí.

Konec rozmazaných písmen: AI konečně čte a píše

Jedním z největších trápení difuzních modelů — technologie, na které stojí většina současných AI generátorů obrázků — byla vždy integrace textu. Systémy jako DALL-E, Midjourney nebo Stable Diffusion budovaly obraz postupně z náhodného šumu, přičemž drobné elementy jako písmena dostávaly nedostatečnou pozornost. Výsledkem byly často nesmyslná slova, překlep nebo vizuálně zkreslené znaky, které okamžitě prozradily strojový původ snímku.

ChatGPT Images 2.0 tento problém podle The Jerusalem Post řeší způsobem, který by ještě před dvěma lety působil jako sci-fi. Model nyní generuje v obrazech čitelný a přesný text, a to i v komplexních jazycích a náročných typografických úlohách. To otevírá dveře praktickým aplikacím: reklamní bannery, restaurační menu, infografiky, komiksové bubliny nebo přímo tiskoviny, které vypadají profesionálně a použitelně bez dodatečných úprav v grafických editorech.

Režim Thinking: když AI plánuje, ne jen kreslí

OpenAI přesně neprozradilo technické detaily nového modelu, ale naznačilo, že Images 2.0 kombinuje schopnosti odpovídající jazykovým modelům. To znamená, že systém už nepouze „kreslí", ale aktivně plánuje obraz předem, rozumí kontextu a v některých případech se dokonce sám kontroluje, než výsledek předloží uživateli.

Klíčovou inovací je provozní režim nazvaný Thinking. V tomto módu model pracuje pomaleji, ale s výrazně vyšší přesností a hloubkou. Dokáže vytvořit konzistentní sérii obrázků z jediného promptu, udržet postavy, styly a objekty napříč různými panely a generovat výstupy jako vícestránkové komiksy nebo kompletní storyboardy. Pro kreativní profesionály a marketingové týmy to znamená zásadní změnu: místo skládání práce z několika nástrojů mohou celou kampaň vygenerovat z jednoho textového zadání, včetně různých formátů pro sociální sítě, web nebo mobilní aplikace.

Silnější ve světových jazycích, ale ne všude

Další výrazný pokrok se týká podpory nelatinkových písem. Dříve bylo generování textu v japonštině, korejštině nebo hindštině téměř nemožné — výsledky trpely chybami a vizuální nekonzistencí. Images 2.0 tyto jazyky zvládá mnohem lépe, což model činí použitelným pro globální trhy a multikulturní obsah.

Pro české uživatele je situace mírně optimističtější než pro mluvčí hebrejštiny, kde systém podle The Jerusalem Post stále tápe a produkuje neobratné chyby. Čeština používá latinku s diakritikou, což je pro AI modely tradičně jednodušší než složité ne latinské skripty. Přesto OpenAI ve svých oficiálních ukázkách češtinu výslovně neprezentuje, a proto je rozumné očekávat spíše dobré než dokonalé výsledky u složitější diakritiky nebo specifické typografie.

2K rozlišení a profesionální využití

Kromě přesnosti textu se zlepšila i samotná kvalita obrazu. Images 2.0 podporuje rozlišení až 2K, zvládá komplexní kompozice, drobné detaily a subtilní stylistické požadavky. Uživatel může model detailně navádět a výsledek mnohem věrněji odpovídá zadání než u předchozích verzí.

Praktický dopad je široký: marketéři mohou vytvářet koncepty kampaní, majitelé restaurací vizuálně atraktivní menu, vývojáři her rychlé návrhy prostředí a učitelé pedagogické infografiky. Přesto je třeba zůstat nohama na zemi — pro finální profesionální tisk a značkovou identitu stále platí, že lidský grafik má poslední slovo. AI je zde silným nástrojem pro návrh a prototypování, nikoliv absolutní náhradou lidské kreativity.

Kde jsou limity?

I přes výrazný pokrok Images 2.0 není dokonalý. Model stále bojuje s úlohami, které vyžadují přesné fyzikální porozumění světu — například skládání origami nebo složité znázornění trojrozměrných objektů. Opakované editace téhož obrázku mohou také vést ke snížení kvality, což je jev známý už z dřívějších verzí.

Rychlost je další kompromis. Zatímco textový výstup z ChatGPT vznikne během sekund, komplexní obrázky mohou trvat několik minut. V režimu Thinking se tato doba ještě prodlužuje. V kontextu toho, co model dokáže, jde však stále o relativně krátký čas — zejména ve srovnání s hodinami ruční grafické práce.

Dostupnost a cena pro český trh

ChatGPT Images 2.0 je dostupné přímo v rozhraní ChatGPT, takže čeští uživatelé k němu mají přístup okamžitě, pokud používají placené předplatné. OpenAI obvykle zařazuje nové obrazové funkce do tarifů Plus (20 USD měsíčně) a Pro (200 USD měsíčně), přičemž uživatelé free verze mohou čerpat omezený počet generování. Pro české firmy a freelancery to znamená nástroj dostupný v řádech stovek korun měsíčně, nikoliv investici do desetitisícových softwarových licencí.

Co se týče regulace, v Evropské unii platí AI Act, který vyžaduje označování obsahu generovaného umělou inteligencí. České firmy by proto měly zajistit, že AI-vytvořené vizuály používané v komerční komunikaci odpovídají pravidlům transparentnosti.

FAQ

Je ChatGPT Images 2.0 dostupné zdarma?

Ano, ale s výraznými omezeními. Uživatelé free tarifu ChatGPT mohou generovat obrázky v omezeném počtu. Plný výkon, vyšší limity a přístup k režimu Thinking vyžadují předplatné Plus za 20 USD měsíčně nebo Pro za 200 USD měsíčně.

Umí ChatGPT Images 2.0 generovat text v češtině?

Čeština používá latinku, kterou model zvládá lépe než složité ne latinské skripty. Přesto OpenAI nezveřejnilo specifické benchmarky pro češtinu a u složitější diakritiky mohou vznikat drobné chyby. Pro krátké nápisy a jednoduché texty je výsledek použitelný, pro profesionální tiskové materiály se doporučuje kontrola.

Jak dlouho trvá vygenerování jednoho obrázku?

Jednoduché obrázky vzniknou během desítek sekund, komplexní scény s textem, komiksové stránky nebo přesné infografiky v režimu Thinking mohou trvat několik minut. To je stále výrazně rychlejší než ruční grafická práce, ale pomalejší než generování textu.