Mojibake
Mojibake (文字化け, izgovori se /modʑibake/) je ime za napačne, nečitljive znake, ki se prikažejo, kadar računalniška programska oprema ne prikaže besedila pravilno. Pri uporabi računalnikov je besedilo kodirano z uporabo kodiranja znakov. Pri prenosu je vsak znak nadomeščen z njegovim položajem (ali številko) v kodiranju. Za ponovni prikaz znaka se položaj ponovno nadomesti z znakom. Če prvotno kodiranje ni določeno, se lahko uporabi drug znak, ko se za prikaz številka ponovno nadomesti z znakom. Unicode je bil uveden, da bi rešil to težavo: UTF-8 lahko večino običajnih znakov kodira v 2 bajtih.
Pred uvedbo kode Unicode so se uporabljale druge kodifikacije znakov. ISO-8859 na primer vsebuje 15 različnih kodiranj. Te so enake za znake, ki se običajno uporabljajo v angleščini. Imajo več "blokov" "posebnih znakov", ki so za vsako kodiranje vloženi drugače.


Tako je lahko videti spletno mesto, če je uporabljeno napačno kodiranje pisave.


Članek za Mojibake na japonski Wikipediji uporablja kodiranje UTF-8. Ta slika prikazuje, kako je videti, ko ga dekodirate s standardnim kodiranjem Windows CP1252.
Izvor besede
Mojibake je japonska beseda. Beseda 文字化け ([moʥibake]) je sestavljena iz dveh delov. 文字 (moji) pomeni črka, znak. 化け (bake) iz glagola 化ける (bakeru) pomeni pojaviti se v preobleki, prevzeti obliko, spremeniti se na slabše. Dobesedno pomeni "sprememba značaja".
Vprašanja in odgovori
V: Kaj je "mojibake"?
O: Mojibake je izraz za nepravilne in nečitljive znake, ki se pojavijo, ko računalniška programska oprema ne prikaže besedila pravilno.
V: Kako je besedilo kodirano pri uporabi računalnikov?
O: Besedilo je kodirano z uporabo kodiranja znakov, pri čemer je vsak znak nadomeščen s svojim položajem ali številko v kodiranju.
V: Kaj se zgodi, če pri prenosu besedila ni določeno izvirno kodiranje?
O: Kadar izvirno kodiranje ni določeno, se lahko uporabi drug znak, ko se številka nadomesti z znakom za prikaz.
V: Kaj je Unicode in kako rešuje to težavo?
O: Unicode je standard kodiranja znakov, ki lahko večino znakov predstavi v dveh bajtih. Rešuje problem uporabe različnih kodiranj znakov in zagotavlja pravilen prikaz znakov.
V: Kateri so primeri drugih kodiranj znakov, ki so se uporabljali pred Unicode?
O: ISO-8859 je primer drugega kodiranja znakov, ki se je uporabljalo pred Unicode.
V: Koliko različnih kodiranj vsebuje ISO-8859?
O: ISO-8859 vsebuje 15 različnih kodiranj.
V: Ali so posebni znaki v ISO-8859 enaki za vsa kodiranja?
O: Ne, posebni znaki v ISO-8859 so za vsako kodiranje različni.