Stap 3: Wat is UTF-8?
UTF-8 is een gemiddelde voor het coderen van alle Unicode-tekens in het midden van een "traditionele" ASCII (platte tekst) bestand.
ASCII-bestanden moet slechts één byte per teken. Het is perfect wanneer u alleen in het Engels schrijft.
Echter, moet u mogelijk een Chinees karakter of een wiskundige formule in het midden van uw tekst schrijven, en UTF-8 maakt het mogelijk: als de code van een Unicode-teken niet in een enkele byte past, het is gecodeerd in 2, 3 of 4 bytes.
Deze codering probeert niet te breken de oude en traditionele ASCII-codering.
Dit betekent dat als u een UTF-8-tekst lezen met een teksteditor die is niet UTF-8 compatibele, noch de editor zal verpletteren, noch bij de opmaak van de tekst zal worden alle verknald.
In plaats van een enkele en juiste Unicode-teken, zal de niet-compatibele editor 2, 3 of 4 uitgebreide ASCII-tekens weergeven.
Aan de andere kant, kan een ongeldige UTF-8-code leiden tot onverwachte problemen als de UTF-8 compatibele tekstverwerker is niet correct gecodeerd.