Stap 6: Ongeldige UTF-8 codes...
.Ongeldige UTF-8 codes kunnen leiden tot verschillende bugs en eventuele crashes als de compatibele toepassing niet naar behoren is geprogrammeerd.
Kan je ongeldige UTF-8 codes omwille van verschillende redenen:
-de tekst is een uitgebreid-ASCII-een (255 char uitgebreid-ASCII gebruikt in plaats van 127)
-de tekst is niet compleet: sommige bytes ontbreken...
-Er is een fout in de toepassing die de UTF-8 gecodeerde tekst heeft gegenereerd...
Uw toepassing moet detecteren dat allemaal!
Als uw toepassing UTF-8 niet op de juiste wijze ontworpen is, is het mogelijk kwetsbaar voor hackers.
Wanneer u uw toepassing ontwerpt, moet u bedenken dat allemaal.
Hier, als een eenvoudig voorbeeld, is een functie te detecteren codering UTF-8 en Unicode uitpakken uit een reeks van tekens (functie niet getest).