Med MySQL , er det to mulige tegnsett tilgjengelig for dine data skal lagres i. Disse Unicode tegnsett reflektere mengden av data som er lagret per tegn i MySQL database. Tre - Byte UTF - 8 Unicode -koding ( UTF - 8 ) tegnsettet er allment anerkjent, men det er ikke standard tegnsett for MySQL . Hva er tegnsett ?
Tegnsett er sett av standarder som inneholder alle de tilgjengelige tastatursnarveiene inndatataster . Den første populære tegnsett ASCII jobbet godt for det engelske språket , men som andre nasjoner begynte å bruke datamaskiner og trenger diversifisert , ble nye tegnsett nødvendig. UCS -2 og UTF - 8 er begge tegnsett i stand til å legge inn data fra nesten alle tastaturet i verden .
UCS - 2 Unicode Encoding ( UCS - 2 )
< p > UCS - 2 er et tegnsett som bruker 16 bits per tegn , støtter Basic Multilingual Plane ( BMP ) . Til sammenligning brukte ASCII bare én byte . Den bit - koden verdier varierer mellom 0 og 65 535 , og i UCS -2 , kan kodes i en fast 16 - bits ord .
Tre- Byte UTF - 8 Unicode Encoding
p Med UTF - 8 , er den samme tegnsett og bit- koden område som benyttes som UCS - 2 , men den bruker kun mellom 02:59 bytes per tegn . Mens UCS -2 kan være kodet på en fast 16 - bits ord , koder UTF-8 enten til 8, 16 eller 24 biter . UTF - 8 er en nyere standard enn UCS -2 .
Hvorfor MySQL Standard er UCS - 2
MySQL er en svært gammel database applikasjon og dens skapelse foran massen gjennomføringen av UTF-8. Derfor har MySQL alltid foretrekkes UCS -2, som er egnet for de fleste database implementeringer. Hvis du ønsker å bruke UTF - 8 i stedet , kan du gjøre det ved å endre databasen innstillingene.