Transkripcija je pretvorba besedila iz drugega medija. V jezikoslovnem in splošnem pomenu vključuje različne postopke prepisovanja – od zapisovanja govora v pisano obliko do preslikave med pisavami ali zlogovnimi sistemi.

Kaj pomeni transkripcija govora

Najpogostejša raba pojma je pretvorba človeškega govora v pisno, strojno ali tiskano obliko: torej zapis, ki odraža, kaj je bilo izrečeno. To lahko naredi človek (prepisovalec) ali stroj (sistemi za avtomatsko prepoznavanje govora). Prepisovalec je oseba, ki izvaja prepise, in se pri tem lahko drži različnih pravil glede natančnosti, vključno z označevanjem premorov, naglasov, poudarkov in neznanih besed.

Vrste transkripcije

  • Fonetična (fizikalna) transkripcija: zapis zvokov govora s sredstvi, ki natančno prikazujejo zvočne lastnosti (npr. s simboli mednarodne fonetične abecede, IPA). Uporablja se v fonetiki in fonologiji za analizo izgovorjave; razlikujemo ozko (natančno, z dodatnimi diakritikami) in široko (poenostavljeno) transkripcijo.
  • Fonematična (fonemska) transkripcija: zapis, ki prikazuje sistem fonemov jezika (abstraktne enote, ki razlikujejo pomen). Fonematične transkripcije običajno uporabljamo pri opisovanju fonološkega sistema jezika in jih pogosto označujemo v poševnicah /.../.
  • Ortografska transkripcija: prepis govori v običajno pisno obliko jezika, prilagojeno standardni pravopisu; uporablja se za podnapise, zapiske in splošno zapisovanje govora za širše občinstvo.
  • Transliteracija: preslikava znakov oziroma črk iz ene pisave v drugo, pri čemer je cilj čim bolj dosledno prenesti zapise, ne nujno izgovorjavo; primeri so preslikave med cirilico in latinico ali med arabščino in latinico.
  • Romanizacija: posebna vrsta transliteracije, ko se zapisi iz ne-latiničnih pisav preslikajo v latinico (npr. Hanyu Pinyin za mandarinščino).

Razlika med transkripcijo in transliteracijo

Pomembno je razlikovati transkripcijo govora in transliteracijo med pisavami. Transkripcija običajno načrtno zajema izgovorjavo (fonetično ali fonemsko), medtem ko je transliteracija postopek, ki preslika črke ali znake iz ene pisave v drugo tako, da ohrani čim bolj dosledno vizualno ali grafemsko ustreznost izvirnika. Na primer, pri ruskem imenu Борис je obliko "Boris" treba razumeti kot transliteracijo, ne kot fonetično transkripcijo v strogem smislu.

Standardi in sistemi

Med standardne transkripcije za jezikoslovne namene spadata mednarodna fonetična abeceda (IPA) in njen ekvivalent v ASCII, SAMPA. Omeniti velja tudi različne sistemske rešitve za romanizacijo in transliteracijo (npr. Hanyu Pinyin za kitajščino, starejši sistem Wade–Giles), pa tudi nacionalne in mednarodne norme, ki urejajo natančno preslikavo znakov iz ene pisave v drugo.

Primeri in pojasnila

V tej tabeli IPA je primer fonetične transkripcije imena nekdanjega ruskega predsednika, v angleščini znanega kot Boris Yeltsin, ki mu sledijo sprejete hibridne oblike v različnih jezikih. Upoštevajte, da je "Boris" transliteracija in ne transkripcija v strogem pomenu besede.

V različnih sistemih bodo iste besede verjetno različno zapisane. Na primer, kitajsko ime za glavno mesto Kitajske v mandarinščini je Peking v splošno uporabljanem sodobnem sistemu Hanyu Pinyin, v zgodovinsko pomembnem sistemu Wade Giles pa je zapisano kot Pei-Ching. V sodobni rabi se pogosto uporablja tudi obliko Beijing, ki sledi pinyin pravilom in bolje odraža glasovno realnost mandarinske izgovorjave.

Praktični prepis je mogoče opraviti tudi v nealfabetični jezik. Na primer, v hongkonškem časopisu je ime Georgea Busha transliterirano v dva kitajska znaka, ki zvenita kot "Bou-sū". (布殊) z uporabo znakov, ki pomenita "tkanina" in "poseben". Podobno so številne besede iz angleščine in drugih zahodnoevropskih jezikov izposojene v japonščino in se prepisujejo z uporabo katakane, enega od japonskih zlogovnih jezikov.

Uporabe transkripcije

Transkripcija in transliteracija se uporabljata v številnih področjih:

  • jezikoslovje in fonetika (analiza izgovorjave, primerjalne študije);
  • ustvarjanje korpusov govora in besedil za raziskave in računalniško obdelavo jezika;
  • prevajanje, slovaropisje in standardizacija imen ter toponimov;
  • podnapisi in zaprti napisi (subtitling/closed captioning) pri filmih in oddajah;
  • forenzična transkripcija (dokazi v pravnih postopkih);
  • razvoj sistemov za prepoznavanje govora (ASR) in sintetizatorjev govora (TTS).

Izzivi in omejitve

Pri transkripciji se pojavljajo številni izzivi:

  • različice izgovorjave (dialekti, akcenti), šumi v posnetku in prekrivanje govora otežujejo natančen zapis;
  • homofoni (besede, ki se izgovarjajo enako) in nejasne mejne točke med besedami vplivajo na interpretacijo;
  • odločitev, ali zapisati vokalne in konsonantne detajle (npr. aspiracija, nosnost, dolžina), vpliva na izbiro med ozko in široko transkripcijo;
  • pri transliteraciji so dileme glede razmerja med ohranjanjem fonetičnega vtisa in dosledno grafemsko preslikavo (različni standardi in konvencije);
  • etični in pravni izzivi (zasebnost govorcev, varovanje občutljivih informacij) pri objavi prepisov.

Človeški vs avtomatski prepisi

Avtomatski sistemi za prepisovanje (ASR) so v zadnjih letih zelo napredovali, vendar še vedno zahtevajo človeški pregled v situacijah, kjer je potrebna visoka natančnost (pravni dokumenti, znanstvene transkripcije). Človek lahko bolje interpretira kontekst, prepozna imena in nepravilnosti ter vnese ustrezno ločila. Avtomatizacija pa je koristna za hiter prepis velikih količin podatkov, ustvarjanje izhodišč za urejanje in za aplikacije realnega časa, npr. podnapise v živo.

Skratka, transkripcija je širok pojem, ki zajema različne metode prepisovanja govora in preslikave med pisavami. Pri delu je pomembno izbrati ustrezen tip transkripcije in sistematično dokumentirati uporabljena pravila in konvencije.