ENCODE enciklopedija funkcionalnih elementov človeškega genoma
ENCODE (ENcyclopedia Of DNA Elements) je velik mednarodni raziskovalni projekt, katerega cilj je bil sistematično identificirati in opisati funkcionalne elemente v človeškem genomu. Projekt je bil uveden leta 2003 in je združil več kot 400 znanstvenikov iz 32 laboratorijev v ZDA, Združenem kraljestvu, Španiji, Singapurju in na Japonskem. Glavne ugotovitve so bile objavljene kot 30 člankov z odprtim dostopom v revijah Nature, Genome Biology in Genome Research, kar predstavlja eno najbolj obsežnih analiz človeškega genoma do zdaj. Projekt je ustvaril obsežen javno dostopen nabor podatkov, ki raziskovalcem omogoča iskanje regulativnih elementov, interpretacijo genetskih variant in načrtovanje nadaljnjih poskusov.
Glavne ugotovitve
Poenostavljen povzetek glavnih rezultatov projekta ENCODE:
- Le približno 1 % človeškega genoma neposredno kodira proteine — to ustreza oceni okoli 21.000 genov.
- Odkritih je bilo okoli 70.000 zaporedij, ki delujejo kot "promotorji" — regije, kjer se pred geni vežejo beljakovine, ki nadzorujejo izražanje genov.
- Identificirali so približno 400.000 "ojačevalnih" (enhancer) območij, ki lahko regulirajo oddaljene gene in so pomembni za specifično časovno in tkivno izražanje.
- Ocenili so obstoj približno štirih milijonov genskih "stikal" — zaporedij DNK, ki nadzorujejo, kdaj in kje se geni vklopijo ali izklopijo; pogosto so locirana precej oddaljeno od genov, ki jih nadzorujejo.
- Približno 80 % genoma kaže neko biokemično aktivnost. To je privedlo do pomembne ugotovitve, da trditev o obsežni "odpadni DNK" ni povsem ustrezna — na mnogih nekodirajočih odsekih DNK se namreč nahajajo regije, ki vežejo beljakovine in molekule RNK ter sodelujejo pri uravnavanju delovanja genov. (Originalna formulacija v poročilu projekta: človeškega genoma ... vidi spodaj.)
- Evolucijske spremembe fenotipov lahko nastanejo tako zaradi sprememb v kodirajočih zaporedjih (gene) kot zaradi sprememb v regulativnih zaporedjih, ki spreminjajo regulacijo genov.
"Eden od velikih izzivov evolucijske biologije je razumeti, kako razlike v zaporedju DNK med vrstami določajo razlike v njihovih fenotipih. Do evolucijskih sprememb lahko pride tako s spremembami zaporedij, ki kodirajo beljakovine, kot tudi s spremembami zaporedij, ki spremenijo regulacijo genov."
Uporabljene metode
ENCODE je kombiniral številne visoko preiskovalne genomike metode za zajem različnih aspektov funkcije DNK:
- Masovno zaporedno določanje RNA (RNA-seq) za izpis transkriptov in za identifikacijo nekodirajočih RNK ter alternativnega splicinga (RNA, ki je bila prepisana iz genoma).
- ChIP-seq za določanje vezavnih mest transkripcijskih dejavnikov in histonskih modifikacij; določili so vezavna mesta za približno 120 transkripcijskih produktov.
- Analize DNase I hipersenzitivnosti in druge metode za zaznavanje odprte kromatine, ki kažejo regije aktivne regulacije; proučevali so vzorce kemičnih sprememb histonov za oceno aktivnih ali utišanih območij.
- Dodatne tehnike vključujejo CLIP-seq za RNA-beljakovinske interakcije, reporter-assaye za funkcionalno preverjanje elementov ter genome-wide eksperimentalne poskuse na različnih vrstah celic.
- Celoten nabor vključuje 1.648 poskusov na 147 vrstah celic, kar omogoča primerjave med tkivi in stanjih.
Pomen in posledice za raziskave
- Interpretacija genetskih variant: vnos regulativnih elementov v katalog pomembno pomaga pri razlagi, kako lahko nekodirajoče variant vplivajo na bolezni (npr. kot zaključek iz GWAS študij).
- Razumevanje razvoja in tkivne specifičnosti: identifikacija ojačevalcev in promotorjev pojasnjuje, kako se enak genom lahko različno izraža v različnih celicah.
- Funkcionalna genomika in molekularna medicina: javno dostopni podatki omogočajo oblikovanje hipotez in ciljanje eksperimentalnih preiskav za validacijo regulativnih elementov, kar pospešuje odkrivanje mehanizmov bolezni in potencialnih terapevtskih tarč.
- Raziskave evolucije: ugotovitve poudarjajo pomen sprememb v regulativnih zaporedjih za fenotipske razlike med vrstami.
Omejitve in razprava
Rezultati ENCODE so prinesli veliko novih spoznanj, vendar so sprožili tudi znanstveno razpravo, predvsem okoli interpretacije podatkov:
- Definicija "funkcije": ENCODE je za identifikacijo funkcije pogosto uporabil kriterij biokemične aktivnosti (npr. vezava beljakovin, transkripcija ali posebne histonske modifikacije). Biokemična aktivnost pa še ne pomeni nujno, da je določen odsek pomemben za organizemovo fitnes ali fenotip. Zato nekateri znanstveniki opozarjajo, da iz 80 % "biokemično aktivnega" genoma ne sledi, da je tako velik delež nujno evolucijsko ohranjen zaradi funkcije.
- Odvisnost od celic in pogojev: mnogi regulativni elementi delujejo le v specifičnih celicah ali v določenih razvojnih/stresnih pogojih, zato en sam nabor celic ne zajame vse možne funkcionalnosti.
- Potrebne so nadaljnje eksperimentalne validacije: reporter assay-i, mutacijski eksperimenti in genetske študije so potrebni, da se potrdi biološki pomen posameznih elementov.
Dostop do podatkov in nadaljnje iniciative
Podatki projekta ENCODE so javno dostopni in jih raziskovalci po vsem svetu uporabljajo kot referenčni vir za interpretacijo genomskih podatkov. Projekt je spodbudil tudi nadaljnje pobude, kot so Roadmap Epigenomics in tipično nadgradnje ENCODE v kasnejših fazah, ki razširjajo število vzorcev, vrst celic in tipov analiz.
Pri delu so bile uporabljene naslednje metode:
- Izolirali in zaporedoma določili RNA, ki je bila prepisana iz genoma.
- Identificirali so vezavna mesta za približno 120 transkripcijskih produktov.
- Preučili so vzorce kemičnih sprememb histonov. S tem so iskali območja, kjer je izražanje genov povečano ali zmanjšano.
- Opravili so 1648 poskusov na 147 vrstah celic.
Novice, povezane s tem delom, so bile široko poročane v znanstvenem in splošnem tisku, saj je projekt ponujal obsežen javni vir podatkov in pomembno spremenil pogled na razširjenost regulativnih elementov v človeškem genomu. Za poglobljeno branje so priporočljive izvirne objave projekta v Nature, Genome Biology in Genome Research, ki predstavljajo tehnične in interpretacijske rezultate celotnega konzorcija.
Vprašanja in odgovori
V: Kaj je ENCODE?
O: ENCODE je kratica za Enciklopedijo elementov DNK. Uvedena je bila leta 2003, da bi opredelili vse funkcionalne elemente (delovne bite) v človeškem genomu.
V: Kdo je opravil delo za ENCODE?
O: Delo je opravilo več kot 400 znanstvenikov v 32 laboratorijih v ZDA, Združenem kraljestvu, Španiji, Singapurju in na Japonskem.
V: Kaj so ugotovili o človeškem genomu?
O: Ugotovili so, da je le 1 % genoma namenjen proteinom, kar je približno 21 000 genov. Poleg tega so odkrili 70 000 zaporedij, ki kodirajo "promotorska" območja pred geni, na katera se vežejo beljakovine in nadzorujejo izražanje genov; 400 000 "ojačevalnih" območij, ki uravnavajo oddaljene gene; in štiri milijone genskih "stikal", ki so zaporedja DNK, ki nadzorujejo, kdaj se geni vklopijo ali izklopijo. Poleg tega je bilo ugotovljeno, da ima 80 % genoma določeno biokemično funkcijo.
V: Kako so izvajali svoje raziskave?
O: Uporabljene metode so vključevale izolacijo in sekvenciranje RNK, prepisane iz genoma; identifikacijo vezavnih mest za produkte transkripcije; preučevanje vzorcev kemičnih modifikacij histonov, da bi našli območja, kjer je izražanje genov povečano ali zmanjšano; in izvedbo 1648 poskusov na 147 vrstah celic.
V: Kaj te raziskave kažejo na evolucijo?
O: Te raziskave kažejo, da evolucijo povzročajo tako spremembe v genih, ki kodirajo beljakovine, kot tudi spremembe v DNK, ki kodira regulativni nadzor. Prav tako kažejo, da lahko evolucijske spremembe potekajo tako s spremembami zaporedij, ki spreminjajo regulacijo genov, kot tudi s spremembami zaporedij, ki kodirajo beljakovine.
V: Kje so bile objavljene njune ugotovitve?
O: Njihove ugotovitve so bile objavljene v 30 člankih z odprtim dostopom v treh revijah - Nature, Genome Biology in Genome Research.