The American National Standards Institute, eller ANSI, Tegnsett inneholder 256 tegn , fra store og små bokstaver til tall , tegnsetting og aksentuerte tegn. Det standardisert grunnleggende tegnsettet som brukes av datautstyr , definerer hvilke tegn som skal inkluderes og i hvilken rekkefølge for å inkludere dem . De første 128 tegnene i full ANSI sett , fra null til 127 , utgjør ASCII-tegn , som inkluderer 32 kontrollsekvenser . Fra 128 til 255, de utvidede ANSI-tegn inkluderer aksentuerte bokstaver, matematiske symboler og line- tegning tegn. Før Standards
verden av databehandling begynte med et Babel av tegnsett , hver enhet maker definere sitt eget sett med innspill og kontroll sekvenser . Disse tidlige system brukt papir hullkort som deres data - lagringsmedium. Posisjonene på et kort som inneholdt eller manglet slag bestemt informasjonen den lagres . IBM , UNIVAC , FORTRAN , STRETCH : hver av disse systemene brukes forskjellige karakter ordninger og antall tegn. Uten en helhetlig standard , manglet disse enhetene muligheten til å snakke med hverandre .
ASCII
Den opprinnelige American Standard kode for Information Interchange , eller ASCII, tegnsett begynte i 1960 med datamaskinen pioneren Bob Bemer , en IBM- ansatt som har innsett at punch- kortet kaos av konkurrerende tidlige operativsystemer holdt tilbake datamaskinen adopsjon. På den tiden brukte IBM seg ulike ni - teiknkodingar blant sine produkter. Bemer sendt en kode - sekvens forslag til ANSI , som til slutt godkjent en plan svært lik Bemer opprinnelige . Atten år senere , ble IBM PC den første datamaskinen som brukes ASCII.
ASCII-tegn
beliggenhet innenfor en numerisk rutenett som strekker seg fra null til 128 , ASCII- tegnsettet begynner med et sett av 32 kontrollsekvenser , noen som ikke lenger ser utbredt bruk og andre, som for eksempel "ESC ", som forblir en del av dagens databehandling. Den " Space" fungerer som tegnet 32 , den 33. i settet , fulgt av ikke- alfabetiske symboler som hash mark , dollartegn , tegnet og tegnsetting. Tallene null gjennom ni utgjør tegn 48 gjennom 57 , etterfulgt av mer tegnsetting og matematiske symboler. Den store alfabetet vises fra 65 til 90 , etterfulgt av flere ikke- alfabetiske tegn . Avrunding ut ASCII settet , 97 gjennom 122 holder små bokstaver alfabetet , etterfulgt av krøllete parentes , røret symbol, tilde og " DEL ", eller slette, karakter.
Utvidede tegn
Den sanne ANSI tegnsett vier posisjoner 128 til 255 til de aksentuerte tegn som brukes av de fleste europeiske språk, inkludert to - tegnkombinasjoner kalt digraphs , og store og små vokaler og konsonanter . Sammen med pre -laget fraksjoner , ikke- engelsk tegnsetting, graden symbol og noen alfanumerisk superscripts , det inkluderer også de greske tegn og ligningen symboler vanlige i matematikk , og et sett av tegn som brukes til å tegne én -og dobbel- styrt ruter, som rammene rundt HTML-tabeller .
Beyond og ved siden av ANSI
Sammen med den sanne ANSI tegnsett , definerer Microsoft Windows ANSI sett en variant med en forveksling lik navn og vesentlig lignende tegn. Det mangler ANSI line- tegning tegn og inkluderer andre skilletegn i stedet , blant dem to varemerke symboler, copyright symbol, en pre-laget ellipse punkt, den kule , em - dash og en- dash . Utover de tradisjonelle 256 -tegns begrensninger av ANSI, gjør Unicode mulige tegnsett med tusenvis av hieroglyfene , imøtekommende nesten alle verdens språk , inkludert de som ikke bruker det latinske alfabetet , som for eksempel Asia og Midt-Østen språk.