Proč zrovna isoleucin?
Harris Wang, systémový a syntetický biolog z Kolumbijské univerzity, se dlouhodobě zabývá otázkou, zda organismy dokážou fungovat s menším počtem aminokyselin. První formy života totiž nemohly vzniknout rovnou s kompletní sadou dvaceti — evoluce musela začít od něčeho jednoduššího.
Jeho tým nejprve analyzoval, jak často se jednotlivé aminokyseliny v proteinech přirozeně nahrazují jinými. Isoleucin byl suverénně nejčastěji substituovanou aminokyselinou — typicky jej zastupoval strukturně podobný valin nebo leucin. To z něj udělalo ideálního kandidáta pro experimentální eliminaci.
Tým si následně vybral jeden z nejtěžších možných cílů: ribozom, obří proteinový komplex, který v buňce funguje jako továrna na proteiny. „Eliminovat aminokyselinu právě z ribozomu je téměř to nejtěžší, co si lze představit — jde o největší a nejsložitější proteinový komplex v buňce," vysvětluje Wang.
Jak do hry vstoupila umělá inteligence
Vědci upravili geny kódující všech 50 proteinových podjednotek ribozomu, které obsahují isoleucin. U každé z nich přepsali DNA sekvence pro isoleucin na sekvence pro valin. U 18 z 50 podjednotek stačila tato přímá výměna a výsledné bakteriální kmeny rostly normálně.
Zbývajících 32 podjednotek ale takto jednoduchou úpravu nesneslo — proteiny ztratily svou prostorovou strukturu a přestaly fungovat. Právě tady přišly ke slovu nástroje umělé inteligence pro predikci proteinových struktur, fungující na principu podobném jako AlphaFold od Google DeepMind nebo ESMFold od Meta AI.
AI modely navrhovaly kompenzační změny: někdy stačilo vyměnit aminokyseliny v těsném sousedství nahrazeného isoleucinu, jindy bylo nutné upravit vzdálenou aminokyselinu, která s problematickým místem interaguje ve složeném proteinu. V několika případech museli vědci přistoupit k systematickému zkoušení — nahrazovali jednu aminokyselinu za druhou, dokud nenašli kombinaci, která bakteriím obnovila růst.
Po úspěšném upravení všech proteinů jednotlivě se tým pokusil zkombinovat 21 přepsaných ribozomálních proteinů v jedné bakterii. Napoprvé to nefungovalo, ale po dalších úpravách vznikl kmen, který rostl — byť pomaleji než standardní E. coli.
Co to znamená pro vědu a biotechnologie
„Je to vskutku monumentální počin — ořezat abecedu života na 19 aminokyselin," komentuje Christopher Snow, proteinový inženýr z Colorado State University, který se na výzkumu nepodílel. Podle něj studie „prohlubuje porozumění konstrukčním pravidlům života".
Výzkum má několik praktických důsledků. Organismy se sníženou závislostí na konkrétních aminokyselinách by mohly lépe přežívat v nepřátelských prostředích nebo odolávat infekcím viry, spekuluje Wang. Pokud bakterie nepotřebuje isoleucin, virus, který se ji snaží napadnout a využít její proteosyntetický aparát, může mít problém.
Ještě zajímavější je druhá implikace: odstraněním isoleucinu se „uvolní" DNA sekvence, které tuto aminokyselinu standardně kódují. Tyto uvolněné kodony by mohly být přeřazeny pro kódování jiných, třeba syntetických aminokyselin, vysvětluje Tom Ellis z Imperial College London. To by umožnilo vytvářet proteiny s novými funkcemi — například stabilnější léčiva nebo enzymy pro průmyslové využití.
Určitou syntetickou aminokyselinu už dnes využívají některá léčiva — například semaglutid, známý z léků na hubnutí a diabetes typu 2. Takzvané nekanonické aminokyseliny zvyšují stabilitu takových sloučenin v těle. Wangův výzkum by mohl tuto technologii posunout na novou úroveň.
450 generací stability — a co dál?
Zajímavým zjištěním je stabilita provedených změn. Po 450 generacích se modifikované E. coli nevrátily k používání isoleucinu v upravených proteinech. To podle Snowa „podporuje myšlenku, že raný život si pravděpodobně nějakou dobu vystačil s menší sadou barev na paletě".
Wangův tým nyní plánuje aplikovat přístup na celý genom E. coli a do budoucna se možná pokusit o bakterii fungující jen s 18 aminokyselinami. Práce ukazuje, že AI nástroje pro predikci proteinových struktur — které byly ještě před pár lety považovány za čistě akademickou zajímavost — nacházejí konkrétní uplatnění v syntetické biologii a genovém inženýrství.
Pro českou a evropskou vědeckou scénu je výzkum relevantní hned v několika rovinách. Evropská unie reguluje geneticky modifikované organismy (GMO) prostřednictvím směrnice 2001/18/ES a souvisejících předpisů — jakýkoli organismus s takto upraveným genomem by podléhal přísnému schvalovacímu procesu. Zároveň ale EU investuje do syntetické biologie v rámci programu Horizon Europe a podobné výzkumy probíhají i na evropských pracovištích, například v EMBL (European Molecular Biology Laboratory) v Heidelbergu nebo na ETH Zürich.
AI jako nepostradatelný nástroj moderní biologie
Wangův experiment je dalším příkladem toho, jak se umělá inteligence stává nepostradatelným nástrojem laboratorní vědy. Ještě před rokem 2020, kdy AlphaFold poprvé prolomil hranice přesnosti predikce proteinových struktur, by takto komplexní návrh proteinových mutací trval měsíce experimentální práce. Dnes jej AI dokáže navrhnout v řádu hodin.
Podobné nástroje jsou dnes volně dostupné výzkumníkům po celém světě, včetně českých vědeckých institucí. AlphaFold a jeho databáze proteinových struktur jsou veřejně přístupné, ESMFold od Meta AI je open-source, a řada dalších nástrojů nabízí bezplatné akademické licence. Pro české výzkumníky v oborech molekulární biologie, bioinformatiky a syntetické biologie to znamená přístup k technologiím, které ještě před pěti lety neexistovaly.
Mohla by bakterie s 19 aminokyselinami přežít mimo laboratoř?
Zatím ne. Modifikované kmeny E. coli v aktuálním experimentu rostou pomaleji než standardní bakterie a byly upraveny jen v části ribozomálních proteinů. Pro přežití v přirozeném prostředí by musela být eliminace isoleucinu dokončena v celém genomu, což je dalším krokem výzkumu. Navíc by jakékoli uvolnění takového organismu podléhalo přísným GMO regulacím EU.
Jaký konkrétní AI nástroj byl v experimentu použit?
Autoři studie v článku pro Science uvádějí využití nástrojů na principu predikce proteinových struktur z aminokyselinových sekvencí a naopak — tedy technologií podobných AlphaFold od Google DeepMind. Konkrétní implementace není veřejně specifikována, ale principiálně jde o stejné deep-learningové modely, které jsou dnes standardem v oboru strukturní biologie. Pro označení typu AI se v odborných kruzích používá termín „protein structure prediction tools" nebo „inverse folding models".
Je tento výzkum relevantní i pro medicínu?
Ano, a to hned dvěma způsoby. Zaprvé, porozumění tomu, jak proteiny tolerují záměny aminokyselin, pomáhá při návrhu stabilnějších terapeutických proteinů a enzymů. Zadruhé, uvolnění kodonů — třípísmenných DNA „slov", která normálně kódují isoleucin — by umožnilo těmto sekvencím přiřadit syntetické aminokyseliny. Toho se již dnes využívá při výrobě léčiv, jako je semaglutid (účinná látka v lécích Ozempic a Wegovy), kde nekanonické aminokyseliny zvyšují stabilitu molekuly v krevním oběhu.