? Muligheten til å skanne et dokument i maskinlesbar form er en makeløs tidsbesparende . Snarere enn å skrive inn dokumentet , og eventuelt sette inn feil av dine egne, skanne det og sende det skannede bildet gjennom en programvare leseren kan resultere i et redigerbart dokument med en høy grad av nøyaktighet i forhold til det opprinnelige . Denne programvaren prosessen kalles optical character recognition . Optical Character Recognition
Optical Character Recognition ( OCR ) er en prosess der trykte eller håndskrevne teksten er mekanisk eller elektronisk lest og omgjort til en form gjenkjent av en datamaskin. Den sofistikerte prosessen ser brevet former og sammenligner dem med et bibliotek av lignende former . Når en kamp er gjort, er et tegn som representerer det mønsteret som vises på skjermen , eller inn i en datafil . OCR gjør det mulig for et dokument som skal skannes og leses av en datamaskin , lage en fil som kan redigeres eller handlet på på andre måter .
OCR -programvare
Computer programvare brukes for moderne OCR implementering . Programvaren har avansert fra de tidligste tider , der programmene måtte kalibreres for hver unike font det var forventet å gjenkjenne. Den er tilgjengelig i frittstående form som et program spesielt laget for oppgaven, og som en komponent i programvare for skanning . Ankomsten av Internett og cloud computing har ført til utvikling av web- baserte OCR-programmer , eliminerer behovet for individuelle desktop eller server installasjoner.
Gjenkjennelsen Process
OCR -programvare fungerer ved først å anerkjenne skillet mellom lyse og mørke områder i det skannede bildet . Som oppdager en lys- mørk skillet , ser programvaren for gjenkjennelige mønstre, for eksempel vertikale og horisontale linjer , samt tilkoblede eller delvis kurver. Hvis det kan gjenkjenne et mønster som et brev eller et annet tegn , søker den sin database for tilsvarende karakter i datamaskinens språk settet. Deretter går dette tegnet på til dokumentet eller vise det montering . Hvis programvaren ikke er i stand til å gjenkjenne en karakter , kan det gjøre sitt beste gjetning eller erstatte en alternativ karakter for å holde prosessen i gang.
Potensielle problemer med OCR -programvare
< p> siden OCR-programvare er avhengig av mønstergjenkjenning , er enhver gjenstand på siden som potensielt kan påvirke denne prosessen en kilde til problemer . OCR fungerer best når det er et klart skille mellom tegnene og bakgrunnen av dokumentet , ideelt sett svart på hvitt . Farget eller opptatt bakgrunn som gjør mønstrene mindre særpreget kan føre til problemer . Flekker , bretter og andre skader på dokumentet, kan resultere i feil tegn anerkjennelse også.