Človeški genom: zaporedje, funkcije in raziskovalni projekti (HGP, ENCODE)
Človeški genom je zapisan v približno 3,1 milijarde osnovnih parov DNK in je razporejen v 23 parih (skupaj 46) kromosomov v kromosomov v celičnem jedru ter v majhnem obročastem mitohondrijski DNK. O zaporedjih DNK, ki sestavljajo naše kromosome, je danes veliko znanega: znamo brati osnovne baze (A, T, C, G), locirati gene in mnoge druge značilnosti. Vendar pa polno razumevanje, kaj posamezne zaporedne enote dejansko počnejo v celici — torej kakšna je njihova biološka funkcija — še vedno zahteva intenzivne raziskave. Uporaba tega znanja v medicini in diagnostiki se šele razvija in že prinaša konkretne rezultate, zlasti na področju genetskih testov, ciljnih zdravil in personalizirane medicine.
Kaj vsebuje človeški genom
Genom vključuje:
- okoli 20.000 do 21.000 protein-kodirajočih genov (čeprav število novih genov in izmeničnih oblik nenehno narašča z boljšimi tehnikami),
- velike dele ne-kodirajoče DNK: regulatorne elemente (promotorje, enhanserje), dolgorepeptitivne elemente, introne in različne vrste nekodirajočih RNA (npr. miRNA, lncRNA),
- ponavljajoče se sekvence, ki zavzemajo približno polovico genoma (transpozoni, sateliti),
- mitohondrijsko DNK, ki je kratka (okoli 16.6 kb), krožna in se običajno deduje po materini liniji.
Referenčni genom in zgodovina projektov
V okviru velikega mednarodnega projekta Human Genome Project (HGP) je bilo ustvarjeno referenčno zaporedje, ki se je po vsem svetu začelo uporabljati kot osnova za raziskave v biologiji in medicini. Javni del projekta je objavil poročilo v reviji Nature, medtem ko je komercialno podjetje Celera objavilo rezultate v reviji Science. Ti članki so opisali, kako so zbran in sestavljen osnutek zaporedja ter podali prve analize genoma.
Glavni mejniki:
- 2001: objava prvega osnutka človeškega genoma (javni HGP in Celera), ki je zajemal pomemben del genoma (približno 90–92 %),
- 2003–2005: objavljeni so bili izboljšani osnutki in popravki, ki so zapolnili večino večjih vrzeli; kljub temu so ostajali zahtevni za sekvenciranje centromer, telomer in zelo ponavljajočih regij,
- 2021–2022: napredki s tehnologijami dolgega sekvenciranja so omogočili projekt Telomere-to-Telomere (T2T), ki je zapolnil preostale vrzeli in ponudil popolnejši referenčni genom za eno haploidno zvezdo,
- 2023 dalje: prizadevanja za pangenom in populacijsko-vključujoče reference (Human Pangenome Reference Consortium) poskušajo zajeti variabilnost med ljudmi in nadomestiti enotno referenco z več haplotipi.
ENCODE in raziskave funkcionalnosti
Najnovejši velik projekt, ENCODE (Encyclopedia of DNA Elements), se osredotoča na ugotavljanje, kateri deli genoma so biokemično aktivni in kako so gen izražanje ter regulacija organizirani. ENCODE uporablja različne eksperimentalne metode (RNA-seq, ChIP-seq, DNase-seq/ATAC-seq, Hi-C itd.) za mapiranje:
- promotorjev in enhanserjev,
- vezav transkripcijskih dejavnikov,
- kromatinskih stanj in tridimenzionalne organizacije genomskega materiala,
- transkriptov, vključno z mnogimi nekodirajočimi RNA.
Uporaba v praksi, izzivi in prihodnost
Znanje o genomu se uporablja v:
- diagnostiki genetskih bolezni (npr. eksomno sekvenciranje, panelski testi),
- onkologiji (sekvenčne analize tumorjev za odkrivanje ciljev zdravljenja),
- farmakogenomiki (napoved odziva na zdravila),
- raziskavah evolucije in populacijske genetike,
- razvoju novih terapij, vključno z gensko terapijo in CRISPR uredjevanjem.
Skupaj gledano, referenčni genom in projekti kot HGP in ENCODE predstavljajo temelj za moderno genomiko — omogočajo prehod od zaporedij kot surovih podatkov k funkcionalnemu razumevanju in kliničnim aplikacijam. Nadaljnji tehnični napredki, večji in bolj raznoliki vzorci ter integracija funkcionalnih podatkov bodo še bolj razjasnili vlogo posameznih delov človeškega genoma v zdravju in bolezni.


Grafični prikaz idealiziranega človeškega kariotipa, ki prikazuje organizacijo genoma v kromosome. Ta risba prikazuje žensko (XX) in moško (XY) različico 23. para kromosomov.
DNK in beljakovine
Človeški genom vsebuje nekaj več kot 20.000 genov, ki kodirajo beljakovine, kar je veliko manj, kot je bilo pričakovano. Dejansko le približno 1,5 % genoma kodira beljakovine, preostanek pa sestavljajo nekodirajoči geni RNA, regulativna zaporedja in introni.
Vendar lahko en sam gen s pomočjo spajanja RNK proizvaja različne beljakovine. En gen Drosophile (DSCAM) se lahko alternativno spoji v 38.000 različnih mRNA. Vsaka mRNA kodira različno peptidno verigo. Zato je število proizvedenih beljakovin veliko večje od števila kodirajočih genov.
Zaradi spajanja RNK in sprememb po prevajanju RNK je skupno število edinstvenih človeških beljakovin lahko le nekaj milijonov.
Mnenje, da je večina DNK neuporabnega "smetja", je napačno. Vsaj 80 % genoma ima določene funkcije.
Razlike med ljudmi in šimpanzi
Danes živeča žival, ki je najbližja človeku, je šimpanz. Človek in šimpanz imata 98,4 % enake DNK. Vendar to velja le za polimorfizme z enim nukleotidom, to je za spremembe le v posameznih baznih parih. Celotna slika je precej drugačna.
Osnutek zaporedja genoma navadnega šimpanza je bil objavljen leta 2005. Pokazalo se je, da regije, ki so si dovolj podobne, da jih je mogoče poravnati med seboj, predstavljajo 2400 milijonov od 3164,7 milijona baz človeškega genoma, kar je 75,8 % genoma.
Teh 75,8 % človeškega genoma se po enonukleotidnih polimorfizmih (SNP - spremembe posameznih "črk" DNK v genomu) za 1,23 % razlikuje od šimpanzovega genoma. Druga vrsta razlik, imenovana "indel" (vstavitve/izbrisi), predstavlja še ~3 % razlike med zaporedji, ki jih je mogoče poravnati. Poleg tega razlike v številu kopij velikih odsekov (> 20 kb) podobnega zaporedja DNK zagotavljajo dodatnih 2,7 % razlike med obema vrstama. Skupna podobnost genomov bi torej lahko znašala le okoli 70 %.
Sorodne strani
Vprašanja in odgovori
V: Kje je shranjen človeški genom?
O: Človeški genom je shranjen na 23 parih kromosomov v celičnem jedru in v mali mitohondrijski DNK.
V: Kaj zdaj vemo o zaporedjih DNK na naših kromosomih?
O zaporedjih DNK na naših kromosomih je zdaj znanega veliko.
V: Kaj je projekt človeški genom?
O: Projekt Human Genome Project (HGP) je projekt, v okviru katerega je bilo izdelano referenčno zaporedje človeškega genoma.
V: Kolikšen je odstotek zaporedja, ki je bil izpolnjen glede na izboljšane osnutke?
O: Izboljšani osnutki, objavljeni leta 2003 in 2005, so zapolnili ≈92 % zaporedja.
V: Kateri je najnovejši projekt, ki preučuje način nadzora genov?
O: Najnovejši projekt, ENCODE, preučuje način nadzora genov.
V: Čeprav je bilo zaporedje človeškega genoma v celoti določeno, ali ga v celoti razumemo?
O: Ne, zaporedje človeškega genoma še ni popolnoma razumljeno.
V: Kaj v genomu počne nekodirajoča DNK?
O: Nekodirajoča DNK v genomu opravlja pomembne naloge, kot so uravnavanje izražanja genov, organizacija kromosomov in signali, ki nadzorujejo epigenetsko dedovanje.