fonetikk er kunsten representerer vokale lyder av tegn og skriftlige karakterer . Stemmegjenkjenning programvare gjør bruk av fonetikk å oversette det talte ordet i teksten , eller for å oversette teksten til det talte ord . Funksjon
tekst til tale-funksjonen er gitt i talegjenkjenning programmer hovedsakelig som en korrekturlesing verktøy , slik at brukeren kan lytte til hva maskinen har tolket . Hvert program inneholder en database på minst 150 000 ord , slik at det å analysere ord og skjulte dem inn tekst eller tale. Nye ord kan legges til i databasen til enhver tid.
Training
Talegjenkjenning programvare krever vanligvis en innledende treningsperioden , hvor brukeren snakker inn i en datamaskin er bygget mikrofon eller et headset. Dette gjør at programmet gjøre seg kjent med brukerens stemme mønstre , noe som sikrer mer nøyaktig oversettelse .
Egenskaper
Voice til tekst fonetikk innebærer å tolke den menneskelige stemme som en bølgeform , en matematisk representasjon av lyd . Ifølge LumenVox Speech Engine nettside , talegjenkjenning programvare analysere egenskapene til lydene avledet fra bølgeform og sammenligne dem med sine egne akustiske modeller .