Človeški genom je zapisan v približno 3,1 milijarde osnovnih parov DNK in je razporejen v 23 parih (skupaj 46) kromosomov v kromosomov v celičnem jedru ter v majhnem obročastem mitohondrijski DNK. O zaporedjih DNK, ki sestavljajo naše kromosome, je danes veliko znanega: znamo brati osnovne baze (A, T, C, G), locirati gene in mnoge druge značilnosti. Vendar pa polno razumevanje, kaj posamezne zaporedne enote dejansko počnejo v celici — torej kakšna je njihova biološka funkcija — še vedno zahteva intenzivne raziskave. Uporaba tega znanja v medicini in diagnostiki se šele razvija in že prinaša konkretne rezultate, zlasti na področju genetskih testov, ciljnih zdravil in personalizirane medicine.

Kaj vsebuje človeški genom

Genom vključuje:

  • okoli 20.000 do 21.000 protein-kodirajočih genov (čeprav število novih genov in izmeničnih oblik nenehno narašča z boljšimi tehnikami),
  • velike dele ne-kodirajoče DNK: regulatorne elemente (promotorje, enhanserje), dolgorepeptitivne elemente, introne in različne vrste nekodirajočih RNA (npr. miRNA, lncRNA),
  • ponavljajoče se sekvence, ki zavzemajo približno polovico genoma (transpozoni, sateliti),
  • mitohondrijsko DNK, ki je kratka (okoli 16.6 kb), krožna in se običajno deduje po materini liniji.
Regulatorni elementi nadzirajo, kdaj in v katerih tkivih se izražajo posamezni geni, in so ključni za razvoj in odziv na okolje. Ponavljajoče sekvence in strukture kromatina pomembno vplivajo na stabilnost genoma ter njegovo evolucijo.

Referenčni genom in zgodovina projektov

V okviru velikega mednarodnega projekta Human Genome Project (HGP) je bilo ustvarjeno referenčno zaporedje, ki se je po vsem svetu začelo uporabljati kot osnova za raziskave v biologiji in medicini. Javni del projekta je objavil poročilo v reviji Nature, medtem ko je komercialno podjetje Celera objavilo rezultate v reviji Science. Ti članki so opisali, kako so zbran in sestavljen osnutek zaporedja ter podali prve analize genoma.

Glavni mejniki:

  • 2001: objava prvega osnutka človeškega genoma (javni HGP in Celera), ki je zajemal pomemben del genoma (približno 90–92 %),
  • 2003–2005: objavljeni so bili izboljšani osnutki in popravki, ki so zapolnili večino večjih vrzeli; kljub temu so ostajali zahtevni za sekvenciranje centromer, telomer in zelo ponavljajočih regij,
  • 2021–2022: napredki s tehnologijami dolgega sekvenciranja so omogočili projekt Telomere-to-Telomere (T2T), ki je zapolnil preostale vrzeli in ponudil popolnejši referenčni genom za eno haploidno zvezdo,
  • 2023 dalje: prizadevanja za pangenom in populacijsko-vključujoče reference (Human Pangenome Reference Consortium) poskušajo zajeti variabilnost med ljudmi in nadomestiti enotno referenco z več haplotipi.
Standardne verzije referenčnega genoma, kot sta GRCh37 (hg19) in GRCh38 (hg38), se še vedno uporabljajo, vendar novejši kompleti in pangenomi bolje zajemajo gensko raznolikost.

ENCODE in raziskave funkcionalnosti

Najnovejši velik projekt, ENCODE (Encyclopedia of DNA Elements), se osredotoča na ugotavljanje, kateri deli genoma so biokemično aktivni in kako so gen izražanje ter regulacija organizirani. ENCODE uporablja različne eksperimentalne metode (RNA-seq, ChIP-seq, DNase-seq/ATAC-seq, Hi-C itd.) za mapiranje:

  • promotorjev in enhanserjev,
  • vezav transkripcijskih dejavnikov,
  • kromatinskih stanj in tridimenzionalne organizacije genomskega materiala,
  • transkriptov, vključno z mnogimi nekodirajočimi RNA.
Ena izmed pomembnih ugotovitev je, da se znaten delež genoma kaže kot biokemično aktiven v vsaj eni celici ali pogoju. Vendar pa obstaja znanstvena razprava o tem, kaj pomeni "funkcija": ali biokemična aktivnost vedno pomeni biološko pomembnost za organizem ali gre pogosto za stranski produkt transkripcijske in kromatinske dinamike. ENCODE je tudi prispeval k razumevanju tkivno-specifične regulacije in mehanizmov, povezanih z boleznimi.

Uporaba v praksi, izzivi in prihodnost

Znanje o genomu se uporablja v:

  • diagnostiki genetskih bolezni (npr. eksomno sekvenciranje, panelski testi),
  • onkologiji (sekvenčne analize tumorjev za odkrivanje ciljev zdravljenja),
  • farmakogenomiki (napoved odziva na zdravila),
  • raziskavah evolucije in populacijske genetike,
  • razvoju novih terapij, vključno z gensko terapijo in CRISPR uredjevanjem.
Kljub temu ostajajo izzivi: razumevanje pomena večine ne-kodirajoče DNK, interpretacija redkih in kompleksnih variacij, zasnova inkluzivnih referenc, varovanje zasebnosti genetskih podatkov in etična vprašanja pri uporabi genomskih informacij.

Skupaj gledano, referenčni genom in projekti kot HGP in ENCODE predstavljajo temelj za moderno genomiko — omogočajo prehod od zaporedij kot surovih podatkov k funkcionalnemu razumevanju in kliničnim aplikacijam. Nadaljnji tehnični napredki, večji in bolj raznoliki vzorci ter integracija funkcionalnih podatkov bodo še bolj razjasnili vlogo posameznih delov človeškega genoma v zdravju in bolezni.