ASCII: ameriška standardna koda — tabela 128 znakov in definicija
ASCII (izgovori se az-kee ali ass-key, če gre za Američana) je tabela znakov za računalnike. Gre za binarno kodo, ki jo elektronska oprema uporablja za obdelavo besedila z angleško abecedo, številkami in drugimi običajnimi simboli. ASCII je okrajšava za American Standard Code for Information Interchange (Ameriška standardna koda za izmenjavo informacij). Razvit je bil v šestdesetih letih prejšnjega stoletja in temelji na prejšnjih kodah, ki so jih uporabljali telegrafski sistemi. ASCII je bil definiran kot 7-bitna koda, kar omogoča 128 različnih vrednosti (0–127).
Zgradba kode in osnovne značilnosti
Koda vsebuje definicije 128 znakov: večina teh znakov so tiskljivi znaki abecede, kot so abc, ABC, 123 in ?&!. Obstajajo tudi kontrolni znaki, ki jih ni mogoče natisniti, temveč nadzorujejo obdelavo besedila, na primer za začetek nove vrstice. Ti znaki običajno zasedajo vrednosti 0–31, medtem ko so tiskljivi znaki v območju 32–126. Poseben znak DEL ima vrednost 127. Večina kontrolnih znakov se danes ne uporablja več za svoj prvotni namen v strojni opremi, a jih protokoli in sistemi še vedno razumejo. ASCII sam po sebi ne vsebuje oblikovnega nadzora (za krepko ali ležečo pisavo itd.), saj nudi le osnovne znake in kontrolne kode.
Najpomembnejši razponi in primeri:
- 0–31: kontrolni znaki (npr. NUL, LF, CR, HT, BEL itd.),
- 32: presledek (space),
- 33–47: ločila in simboli,
- 48–57: številke '0'–'9',
- 65–90: velike črke 'A'–'Z',
- 97–122: male črke 'a'–'z',
- 127: DEL (delete).
Včasih kdo govori o datoteki ali dokumentu v ASCII, kar pomeni, da je v navadnem besedilu.
Primeri binarnih in številskih predstavitev
V 7-bitni obliki ASCII predstavlja 1000001 (7 bitov) veliko črko A; to ustreza 65 v decimalni (bazi 10) zapisih in 41 v šestnajstiškem sistemu. Podobno 1000010 predstavlja B, 1000011 predstavlja C itd. Ko se ASCII prenaša ali shranjuje v sodobnih sistemih, se pogosto uporablja 8-bitni bajt, kjer je najvišji (8.) bit lahko nič ali pa ga uporabijo za pariteto ali razširitve znakov. Zato v praksi pogosto slišimo, da se ASCII »shrani v 8 bitih«, vendar je originalni standard 7-bitni.
Osem bitov je omogočalo vključitev bita paritete v vsak bajt, poslan prek zaporednih vrat ali modemov; ta bit se uporablja za zaznavanje napak. To je bilo pomembnejše pred leti, ko so bile povezave pogosto hrupne.
Kontrolni znaki — najpogosteje srečani
Spodaj je seznam nekaterih najpogosteje omenjanih kontrolnih znakov (ime in dekadna koda):
- NUL (0) – konec niza / ničelni znak,
- SOH (1), STX (2), ETX (3) – začetki/predenje prenosov (zgodovinsko),
- EOT (4) – konec prenosa,
- ENQ (5), ACK (6) – poizvedbe / potrditev,
- BEL (7) – zvok (zvonenje),
- BS (8) – backspace,
- HT (9) – horizontalni tabulator (tab),
- LF (10) – line feed (nova vrstica, '\n'),
- VT (11), FF (12) – vertikalni tabulator / form feed,
- CR (13) – carriage return (vrni k začetku vrstice, '\r'),
- ESC (27) – escape,
- DEL (127) – delete.
Razširitve in sodobna uporaba
Ker je bilo za nekatere jezike in posebne simbole potrebno več kot 128 znakov, so nastale 8-bitne razširitve ASCII (npr. ISO-8859-1, Windows-1252). Kasneje pa je Unicode (in njegova kodna oblika UTF-8) postal prevladujoč standard za večjezično predstavitev znakov. Pomembno je, da so prvih 128 znakov Unicode enakovredni ASCII — to pomeni, da je ASCII neposredno združljiv z UTF-8: bajti 0–127 v UTF-8 predstavljajo iste znake kot v ASCII.
ASCII ostaja temelj številnih protokolov in formatov (npr. HTTP glave, e-poštni naslovi v omejeni obliki, številne skripte in konfiguracijske datoteke), zato je poznavanje osnov ASCII še vedno uporabno pri razumevanju delovanja besedilnih podatkov in prenosov med sistemi.


95 grafičnih znakov ASCII, oštevilčenih od 32 do 126 (decimalno).
Razširjeni ASCII
ASCII nima diakritičnih znakov (znakov, ki so dodani črki, kot so pike (umlauts) nad samoglasniki v nemščini ali tilda (~) nad črko 'n' za črko 'ñ' v španščini). Namenjen je bil samo angleščini in ne deluje dobro za večino drugih jezikov. Nekatere angleške besede, izposojene iz drugih jezikov, prav tako uporabljajo ta znamenja, na primer resumé (glej Dodatek:Angleške besede z diakritičnimi znaki).
Zaradi tega so nekateri sistemi namesto 7 bitov uporabljali 8 bitov (celoten bajt). Pravilno ime za sisteme, ki uporabljajo 8 bitov, je razširjena ASCII. Osem bitov omogoča 256 znakov. Prvih 128 znakov mora biti enakih kot pri ASCII, preostali pa se običajno uporabljajo za abecedne črke z naglasi, na primer É, È, Î in Ü. To rešuje problem jezikov, ki temeljijo na latinici, čeprav vsi razširjeni sistemi ASCII niso enaki. Druge abecede, kot sta grška abeceda in cirilica, potrebujejo drugačen nabor znakov. Nekateri sistemi, na primer tisti, ki uporabljajo kitajske znake, pa še vedno ne delujejo, saj uporabljajo na tisoče znakov. Zato je bil ustvarjen sistem unicode, da bi imeli vsi jeziki enoten sistem.
Standard ASCII se še vedno pogosto uporablja, zlasti v računalniški programski opremi in datotekah HTML. Do leta 2010 je bil standard za URL-je. Spletna stran, ki ima polja za vnos besedila, pogosto sprejme samo besedilo ASCII. Vse posebne oznake za krepko ali sredinsko besedilo itd. bodo prikazane nepravilno.
Vprašanja in odgovori
V: Kaj je ASCII?
O: ASCII je tabela znakov za računalnike, ki uporablja binarno kodo za obdelavo besedila z angleško abecedo, številkami in drugimi običajnimi simboli.
V: Kaj pomeni ASCII?
O: ASCII je kratica za American Standard Code for Information Interchange.
V: Kdaj je bil ASCII razvit?
O: ASCII je bil razvit v šestdesetih letih prejšnjega stoletja.
V: Koliko znakov vsebuje koda?
O: Koda vključuje definicije 128 znakov, ki jim je dodeljeno število od 0 do 127.
V: Koliko bitov je potrebnih za predstavitev znaka ASCII?
O: Za predstavitev znaka ASCII je potrebnih 7 binarnih številk (bitov).
V: Ali računalniška datoteka ASCII uporablja en bajt na znak?
O: Da, računalniška datoteka ASCII uporablja en bajt na znak z 8 biti na bajt.
V: Ali se standard ASCII danes še vedno pogosto uporablja? O: Da, standard ASCI se danes še vedno pogosto uporablja, zlasti v računalniški programski opremi in datotekah HTML.