UTF-8 is een "variabele lengte tekencodering" die wordt gebruikt voor het coderen van tekens die niet beschikbaar zijn in de nu verouderde ASCII-teken ingesteld (aka "platte tekst").
Met UTF-8, kunt u elk teken dat is gedefinieerd in de Unicode-standaard coderen: geaccentueerd brieven, Japanse lettergreepschriften, Chinese karakters, Arabische abjads, wiskundige en wetenschappelijke symbolen, enz.
UTF-8 is de meest gebruikte standaard voor tekencodering.
Internationale sites zoals Wikipedia gebruiken.
Opmerking: In dit instructable, pseudo-codes zal worden geschreven in een C/C++ dialect en echte monster codes zal worden geschreven in C.