Datamaskiner forstår ikke tekst og symboler problemfritt. I stedet bruker de en koding språk kjent som Unicode til å oversette tall og bokstaver til deres passende tekst og symboler , kjent som en Charset . De vanligste typene av Unicode er UTF - 8 , UTF -16 , ISO -8859 -1 og ASCII. Det er en unik identifikator for hver tekstlig bokstav og symbol i Unicode , som forblir konstant på tvers av ulike operativsystemer og programmeringsspråk. De fleste programmeringsspråk har innebygde funksjoner for å oversette mellom ulike Unicode standarder. Instruksjoner
en
Oversett til charset i PHP. Type " utf8_decode ( $ data ) , " hvor " $ data " peker til UTF - 8 -kode. Den resulterende ISO - 8859-1 charset mates ut .
2
Oversett til charset i Perl . Type " bruke Socket qw ( from_utf8 to_iso88591 ) ;
from_to ( $ data , " utf8 "," iso -8859 -1 " ); . " Erstatt "fra - utf8 " med UTF - 8-kodet tegnsett og " to_iso88591 " med ønsket ISO -8859- 1 utgang .
3
Oversett til charset i Python . Skriv inn følgende kode .
Source_encoding = " utf- 8 "
string = utf8variable
string = string.encode ( source_encoding )
string = unicode ( string , ' iso -8859- 1' )
Erstatt " utf8variable " med variabelen holder UTF - 8 tegnsett .