Přejít k hlavnímu obsahu

AI odkrývá tajemství Herkulaneu: Jak umělá inteligence čte spálené svitky staré 2000 let

Ilustrační obrázek
Vědci dosáhli milníku, který se dříve zdál být nemožný. Pomocí pokročilých algoritmů umělé inteligence se podařilo virtuálně rozvinout a přečíst části starověkých svitků z Herkulaneu, které byly téměř 2 000 let pohřbeny pod vrstvou sopečného popelu po erupci Vesuvu. Tato technologie umožňuje číst text bez fyzického kontaktu s křehkým materiálem, čímž chrání historické artefakty před zničení.

Představte si materiál, který je tak křehký, že se při jakémkoliv pokusu o jeho dotek rozpadne v prach. Představte si text, který je pro lidské oko naprosto neviditelný, protože se nachází na povrchu zčernalé, spálené hmoty. Pro archeology byly svitky nalezené v Herkulaneu po staletí jen "černými kusy uhlí". Dnes však díky umělé inteligenci a pokročilému počítačovému vidění získáváme možnost nahlédnout do myšlenek lidí, kteří žili v antickém světě.

Technologie za neviditelným textem

Klíčem k tomuto úspěchu není jen samotný model AI, ale kombinace špičkového hardwaru a specifických algoritmů. Proces začíná použitím mikro-CT skenování (rentgenové tomografie), které vytvoří extrémně detailní 3D mapu svitku. Pro člověka je tato mapa stále jen nečitelným shlukem hustot, ale pro specializované neuronové sítě je to pokladnice dat.

V tomto případě se nejedná o klasické zpracování textu, jaké známe z ChatGPT nebo Claude. Zatímco tyto modely (LLM – Large Language Models) pracují s již existujícím textem, zde jde o počítačové vidění (Computer Vision). Algoritmy jsou trénovány na rozpoznávání mikroskopických rozdílů v hustotě materiálu. Inkoust, i když je spálený, obsahuje drobné částice kovů nebo uhlíku, které mají jinou hustotu než samotný papyrus. AI dokáže tyto rozdíly identifikovat a "vytáhnout" tvary písmen z šumu dat.

Tento přístup využívá techniky známé jako segmentace obrazu. Algoritmus rozděluje obraz na jednotlivé části a určuje, která část patří k podkladu a která představuje stopu inkoustu. Je to proces, který vyžaduje obrovský výpočetní výkon a preciznost, kterou lidské oko prostě nedokáže udržet.

Srovnání: LLM vs. specializované vidění

Je důležité pochopit rozdíl mezi nástroji, které používáme běžně, a technologiemi použitými pro tento výzkum. Pokud byste vzali nejmodernější model jako GPT-4o nebo Gemini 1.5 Pro a pokusili se jim ukázat rentgenový snímek spáleného svitku, pravděpodobně by selhaly. Tyto modely jsou optimalizovány pro srozumitelnost lidské řeči a obecné pochopení světa.

Vlastnost Obecné LLM (GPT/Gemini) Specializované Vision AI
Primární úkol Generování textu, logika, konverzace Detekce vzorů v nekonvenčních datech
Vstupní data Text, běžné fotografie 3D rentgenové mapy, mikroskopické skeny
Přesnost Vysoká v jazykových úlohách Extrémně vysoká v detekci textur

Praktický dopad: Co to znamená pro vědu a budoucnost?

Tento průlom má hluboký dopad nejen na archeologii, ale i na širší technologický trh. Prvním významným aspektem je demokratizace vědy. Díky projektům jako Vesuvius Challenge se data zpřístupňují široké komunitě vývojářů a studentů po celém světě. To, co dříve vyžadovalo desetiletí práce expertních archeologů, nyní může díky spolupráci s AI komunou zvládnout skupina talentovaných programátorů během měsíců.

Pro český a evropský technologický sektor to představuje obrovskou příležitost. Evropská unie skrze programy jako Horizon Europe masivně investuje do výzkumu v oblasti digitální transformace a AI. Firmy specializující se na počítačové vidění, analýzu dat nebo výrobu pokročilého laboratorního vybavení mohou v těchto projektech hrát klíčovou roli. V českém kontextu můžeme vidět podobné aplikace v medicíně (analýza rentgenových snímků nebo MRI) či v průmyslové automatizaci (kontrola kvality materiálů).

Co to znamená pro běžného uživatele? I když se vám zdá, že čtení starověkých svitků nemá s vaším každodenním životem nic společného, technologie vyvinuté pro tento účel se postupně přelévají do civilního sektoru. Lepší algoritmy pro analýzu obrazu znamenají přesnější diagnostiku v nemocnicích, efektivnější kontrolu potravin v potravinářství a lepší bezpečnostní systémy, které dokážou rozlišit skutečnou hrozbu od běžného pohybu.

Závěr

Úspěch při dešifrování svitků z Herkulaneu potvrzuje, že umělá inteligence není jen nástrojem pro psaní e-mailů nebo generování obrázků. Je to mocný nástroj pro objevování pravdy skryté v datech, která jsou pro nás lidské oči neviditelná. Jsme svědky éry, kdy technologie umožňuje lidstvu znovu získat ztracenou historii bez rizika jejího poškození.

Musí být svitky fyzicky rozbaleny, aby se z nich daly přečíst texty?

Nikoliv. Díky technologii virtuálního rozvinutí (virtual unrolling) dokáže AI analyzovat 3D data získaná ze skenů a "rozvinout" vrstvy papyru digitálně, aniž by se kdy dotkla původního objektu.

Je tato technologie dostupná pro běžné firmy?

Samotný výzkumný software je často open-source nebo akademický, ale principy počítačového vidění a segmentace jsou široce dostupné skrze knihovny jako TensorFlow nebo PyTorch. Firmy si tyto modely mohou trénovat na vlastních datech pro specifické účely (např. v medicíně).

Jaká je cena za využití takových technologií?

V akademickém prostředí jsou náklady primárně spojeny s výpočetním výkonem a vybavením pro skenování. Pro komerční využití v průmyslu závisí cena na komplexnosti řešení, ale často se využívá model "AI as a service", kde platíte za analýzu dat.

X

Nezmeškejte novinky!

Přihlaste se k odběru novinek a aktualit.