? En talesyntese server er en datamaskin i nettverket som ber en menneskelig bruker for innspill ved hjelp av tale . Disse serverne er avhengige av mange komplekse underliggende teknologier , for eksempel tekst -til-tale , talesyntese og talegjenkjenning . Lære om disse teknologiene , og hvordan de virker sammen, kan gi deg en bedre forståelse for den komplekse interne driften av talesyntese server. Talesyntese Server
Mange callsentre bruke talesynteser servere for å rute innringere fra hovedmenyen til en menneskelig operatør som jobber i en bestemt avdeling . Disse servere er vanligvis i stand til å produsere tale , så vel som å forstå den. Talesynteser servere er også brukt i web-applikasjoner for å gjøre dem mer tilgjengelige og interaktive.
Speech Synthesis Engine
talesyntesemotoren godtar inndata i form av forhåndsprogrammerte tekst eller sanntid kommandoer og utganger gjenkjennelig tale . Talesynteser motorer som prosessen forhåndsprogrammerte teksten ofte utføre en enkelt oppgave, for eksempel å informere besøkende at en viss området er off-limits . Talesynteser motorer som godtar sanntid kommandoene brukes for å gi funksjonshemmede med et middel til å kommunisere , og brukes også i telekommunikasjonssystemer . Stemmen som du hører fra disse systemene er en kombinasjon av menneskelige stemme prøver og algoritmer som skaper en illusjon av glatt tale.
Voice Recognition
Talegjenkjenning systemer fungerer i motsatt retning . De tolker en menneskelig tale og konvertere den til tekst. Språkregistreringsdata systemer bruker en fremgangsmåte for å tolke et menneskelig tale som er basert på sannsynlighet, . For eksempel , i en enkel stemme gjenkjennelse system der de eneste akseptable innganger er "ja" eller " nei", maskinen er i stand til å beregne sannsynligheten for at en bruker er å si det ene eller det andre . Dette er mulig fordi stemmegjenkjenning systemet kan sammenligne fonetiske lyder av hver inngang mot en database av prøver . Prinsippet er det samme for systemer med mange innganger , selv om sannsynligheten for feil er høyere.
Tekst - til-tale
Tekst -til-tale er en teknologi som konverterer menneske- gjenkjennelig tekst i en fonetisk form , deretter konverterer det inn lyd ved hjelp av høyttalere. En stor del av denne prosessen er opptatt med å tolke teksten og bryte det ned i biter . Hver brikke kan være sammensatt av flere ord , og representerer individuelle setninger . På denne måten kan tekst-til - tale-motor gjengi tale som høres naturlig å menneskelige lyttere. Sofistikerte tekst-til - tale-motorene ytterligere bryte disse enhetene i individuelle stavelser , komplett med tonehøyde og varighet informasjon.