Přejít k hlavnímu obsahu

Proč mluvíme jako ChatGPT? Algoritmy a jazykové modely tiše přepisují náš slovník i myšlení

Ilustrační obrázek pro jarvis-ai.cz
Když v angličtině napíšete slovo delve, zní to dnes skoro jako byste si objednali ChatGPT. A není to náhoda. Frekvence tohoto slova v anglických textech za poslední dva roky vyskočila o desítky procent — a může za to umělá inteligence. Ne proto, že by byla génius, ale proto, že OpenAI outsourcovala část tréninku svého modelu do Nigérie. Tam se slovo delve používá výrazně častěji než v Evropě nebo USA. A tak se rázem dostalo do tisíců textů generovaných AI, odkud prosáklo do lidské komunikace. Nejde ale jen o jedno slovo. Jde o to, že algoritmy — ať už ty za sociálními sítěmi, nebo za jazykovými modely — začínají přepisovat nejen to, jak mluvíme, ale především jak přemýšlíme.

Delve efekt: Když AI outsourcuje váš slovník

Americký lingvista Adam Viktor Aleksic, známý online jako Etymology Nerd, ve svém TED Talku popsal fenomén, který si málokdo uvědomuje: lidská komunikace se čím dál víc podobá výstupům velkých jazykových modelů (LLM).

Slovo delve je ukázkovým příkladem. OpenAI při tréninku ChatGPT využívala pracovníky z Nigérie, kde je toto slovo běžnou součástí formální angličtiny. Model se jej „naučil" používat, začal ho generovat ve svých odpovědích, a uživatelé — často nevědomky — ho začali přebírat do vlastního vyjadřování. Zpětná smyčka se uzavřela: AI formuje lidský jazyk a lidé ho vracejí zpět do tréninkových dat.

Nejde přitom o okrajový jev. Studie publikovaná v časopise Science v roce 2024 ukázala, že texty generované LLM vykazují výrazně nižší lexikální diverzitu než lidské psaní — používají menší sadu „oblíbených" slov opakovaně. Když tyto texty zaplaví internet, vzniká zpětná vazba: modely trénované na AI-generovaném obsahu se samy stávají jednotvárnějšími. Vědci tento efekt označují jako model collapse — zhroucení kvality modelu v důsledku trénování na vlastních výstupech.

Algoritmus jako filtr reality

Problém ale nespočívá jen v jazyce samotném. Stejný mechanismus působí i na úrovni toho, co vůbec vidíme a o čem přemýšlíme. Algoritmy sociálních sítí — od TikToku přes Instagram po X (dříve Twitter) — nám systematicky předkládají nejextrémnější výsek reality. Proč? Protože kontroverzní, šokující nebo rozhořčený obsah generuje nejvíc interakcí. Čím extrémnější tvrzení, tím větší šance, že se stane virálním.

Typický příklad z českého prostředí: prohra hokejové reprezentace se Slovinskem na sociálních sítích vyvolá mnohonásobně vyšší aktivitu než výhra nad Itálií. Algoritmus se to naučí — a příště vám ukáže další prohry, další kontroverze, další důvody k rozhořčení. Neutrální realita nemá v tomhle systému místo.

Jak ukazuje kniha Faktomluva od Hanse Roslinga, lidské odhady v klíčových otázkách — od globální chudoby po úroveň vzdělání — jsou systematicky horší než realita. Algoritmy tento efekt ještě prohlubují. Problém nastává ve chvíli, kdy lidé začnou zkreslenou verzi reality zaměňovat za tu skutečnou.

AI chatboti nejsou neutrální — a nemůžou být

Podobný mechanismus funguje i u AI chatbotů. Informace, které modely sdílejí, podléhají zkreslení — do jejich tréninku zasáhl člověk se svými předsudky, kulturním kontextem a jazykovými návyky. Žádný model není „objektivní".

„Výzkumy zjistily, že ChatGPT odpovídá konzervativněji, když s ním uživatelé komunikují persky," uvedl Aleksic v TED Talku. Důvody jsou dva: íránský jazykový model není natolik vytrénovaný jako anglický a země dlouhodobě tenduje ke konzervativnějším postojům, což se odráží v trénovacích datech.

Stejně tak Grok od Elona Muska není neutrální. Musk si model denně přizpůsobuje podle své potřeby, aby interagoval tak, jak on chce. Uživatelé platformy X (kde je Grok integrován) tak nevědomky přejímají Muskův světonázor — jednoduše proto, že jinou odpověď od AI nedostanou.

To vyvolává zásadní otázku: budou Íránci při každodenním používání AI smýšlet konzervativněji? Budou uživatelé X nevědomky přejímat Muskovu optiku? Odpověď není jednoduchá, ale výzkum naznačuje, že ano — lidé mají tendenci důvěřovat AI výstupům a přizpůsobovat jim své názory.

Realita, kterou algoritmy samy vytvářejí

Nejzáludnější aspekt celého fenoménu spočívá v tom, že algoritmy aktivně vytvářejí realitu, kterou pak jen zdánlivě popisují. Platformy předhazují lidem trendy, jež by bez algoritmického zesílení vůbec nevznikly.

Představte si to takto: algoritmus TikToku zaznamená, že několik uživatelů začalo používat určitou frázi. Začne ji doporučovat dalším. Ti ji převezmou. Fráze se stane „trendem". Algoritmus ji dál zesiluje. Nakonec se dostane do mainstreamové komunikace, odkud ji převezmou jazykové modely, které ji začnou používat ve svých odpovědích. A kruh se uzavírá.

Tohle není sci-fi. Je to přesně mechanismus, který stojí za vzestupem slova delve. A není důvod myslet si, že delve bude poslední.

Co to znamená pro Česko?

Pro české uživatele je situace specifická. ChatGPT, Claude, Gemini a další modely sice podporují češtinu, ale jejich tréninková data jsou dominantně anglická. Když komunikujete česky, model vnitřně „přemýšlí" v angličtině a výsledek překládá. To znamená, že do češtiny pronikají nejen anglické jazykové vzorce, ale i kulturní kontext a hodnotové rámce anglicky mluvícího světa.

Evropská unie na to reaguje prostřednictvím AI Actu, který zavádí požadavky na transparentnost a označování AI-generovaného obsahu. Od roku 2026 platí povinnost označovat deepfakes a texty generované umělou inteligencí — právě proto, aby lidé věděli, s čím interagují. Český Národní úřad pro kybernetickou a informační bezpečnost (NÚKIB) se na implementaci těchto pravidel aktivně podílí.

Zároveň roste význam českých jazykových modelů — například modelu od týmu z Matematicko-fyzikální fakulty UK. Čím víc budou Češi používat modely trénované na českých datech, tím menší bude riziko nevědomého přejímání cizích jazykových a myšlenkových vzorců.

Jediná účinná obrana: ptát se proč

Závěr není nijak složitý, ale je náročný na provedení. Cokoli, co nám internet předkládá — ať už prostřednictvím sociálních sítí, nebo AI —, prošlo filtrem. Sociální sítě filtrují feed. AI filtruje odpovědi. Ani jedno není neutrální zrcadlo reality.

Nejúčinnějším nástrojem obrany je jediné slovíčko: proč. Proč právě tohle vidím, když otevřu Reels na Instagramu? Proč používám zrovna tohle slovo? Proč mi ChatGPT odpověděl právě takhle? Co platformě přináší, že reaguji přesně tímto způsobem?

Jak říká Aleksic: „Jakmile si tyto otázky přestaneme klást, jejich verze reality se stane naší."

Je používání ChatGPT nebo jiných AI chatbotů škodlivé?

Samo o sobě není. Problém nastává, když výstupy AI přijímáme nekriticky a neuvědomujeme si, že prošly filtrem — jazykovým, kulturním i hodnotovým. Zdravý přístup je používat AI jako nástroj, ale zachovat si vědomí toho, že odpovědi nejsou objektivní pravdou, ale výsledkem statistického modelu natrénovaného na datech s konkrétními zkresleními.

Jak poznám, že je text napsaný umělou inteligencí?

Stoprocentně spolehlivý detektor neexistuje, ale existují náznaky: opakování určitých slov (v angličtině typicky „delve", „tapestry", „crucial"), uniformní styl bez osobního tónu, příliš dokonalá struktura odstavců a absence konkrétních osobních zkušeností. EU AI Act od roku 2026 vyžaduje, aby poskytovatelé AI systémů označovali generovaný obsah — v praxi se to ale zatím týká hlavně deepfakes a vizuálního obsahu.

Ovlivňuje AI i češtinu, nebo jen angličtinu?

Ovlivňuje obojí, ale mechanismy jsou odlišné. V angličtině jde o přímé přebírání slov a frází z AI výstupů. V češtině je efekt zprostředkovaný — čeští uživatelé konzumují AI-generovaný obsah převážně v angličtině a nevědomky přejímají anglické jazykové vzorce, kalky a stylistické postupy. Navíc modely jako ChatGPT při generování češtiny vycházejí z anglických tréninkových dat a „překládají" myšlenkové vzorce — výsledkem je čeština, která občas zní podezřele jako překlad z angličtiny.

X

Nezmeškejte novinky!

Přihlaste se k odběru novinek a aktualit.