Tesseract Optical Character Recognition bibliotekene tilbyr utviklere en metode for å skanne dokumenter og tekst til et bilde. Du bruker Tesseract bibliotekene til å lagre bilder av dokumenter som du ikke lenger trenger i papirutgave . Du bruker Tesseract bibliotekene i Java ved looping gjennom hver karakter og skrive tegnet til en fil . For å bruke bibliotekene , må du ta med Java namespace for OCR funksjoner . Instruksjoner
en
Høyreklikk Java -filen du vil bruke til å opprette OCR dokumentet . Klikk på " Åpne med " og velg din foretrukne Java editor.
2
Legg til OCR bibliotek namespace på toppen av filen. Kopier og lim inn følgende kode i kildekoden filen:
com.tplan.robot.imagecomparison.tesseractocr
3
Lag koden som skanner tegn til filen . For eksempel følgende kode looper gjennom hvert tegn i en fil og skriver det til en bildefil :
Var linjer = 0Compareto metoden = " tocr " cmparea = " x : 33 , y: 2 , w : 200 , h: 22 " for (i = 1 , {i } < { linjer } 1 , i = {i } 1 ) { Typeline " { _TOCR_LINE {i } } "}
4
Klikk på Java redaktørens " Lagre"-knappen , og klikk " Kjør" for å kjøre koden i en Java debugger .