Unicode Transformation Format ( UTF - 8 ) er en tegnkoding format som bruker åtte -bits blokker for å representere et tegn, og er mye brukt i datasystemer . Det inkluderer den samme kompakte ren tekst koding som ASCII -format, men også gir mulighet for koding av spesialtegn. Dette gir det ekstra funksjonalitet , men skaper utfordringer når det brukes i programkode. De senere versjoner av Perl skip med koding moduler og en binmode funksjon som gjør at programmeringsspråk for å håndtere koding og dekoding av UTF - 8 filer . Inngang og utgang til /fra et Perl program kan gjøres for å håndtere UTF- 8 tegn gjennom bruk av en bryter på kommandolinjen . Du trenger
ActiveState Perl
Perl editor
Vis flere instruksjoner
en
starte Perl editor for å starte koding Perl program . Du kan bruke en enkel tekst editor , for eksempel Notisblokk i Windows, eller vi-editoren på UNIX. Du må lagre filen med en . Pl forlengelse slik at systemet vil være i stand til å gjenkjenne det som et Perl program .
2
inn en maktpåliggende å kreve "kode " -modulen på toppen av Perl program . Du vil være i stand til å benytte koding og dekoding funksjoner i kroppen av Perl Program for å kode /dekode data inn /ut av UTF- 8-format , etter behov. Skriv inn følgende i Perl editor å bruke denne metoden : en
# /usr /bin /perlrequire Socket ; Alternativt kan du ringe Socket modul, som følger: ! Bruke Socket ; å kode data , skriver du inn følgende inn i kroppen av programmet : $ output = Socket :: kode ( " utf8 ", $ streng) ;
3
Angi UTF - 8-koding format når du åpner et filen. Du kan gjøre dette ved å skrive inn en av følgende formater inn redaktøren:
Åpne fil , " < : koding ( iso -8859 -7) ", $ inputFile ;
åpen fILE, " < : utf8 " . , $ inputFile ;
p Dette vil fortelle Perl å kode filen i UTF - 8-format , eller for å forberede UTF - 8-koding
4
Spesifiser " binmode " når du leser eller skriver filer , for å sikre at filene er kodet i UTF - 8-format.
å angi binmode til UTF - 8 når du leser en fil , skriver du inn følgende inn i editoren : $ filename = " filnavn.txt "; $ inputFile = IO :: Fil - > new ( $ filename , 'r '); binmode ( $ inputFile , ': utf8 ');
< p > For å sette binmode til UTF - 8 når du skriver til en fil , skriver du følgende inn i editoren : $ filename = " filnavn.txt "; open (OUT , "> $ filnavn "); binmode (OUT , " ; : utf8 ");
Du kan også bruke binmode angi format for standard inngang og utgang til UTF - 8 , som følger: binmode ( STDIN , ': utf8 '); binmode ( STDOUT , ': utf8 ');