Taleteknologi

Vårt hovedfokus innen taleteknologi ligger i dag på automatisk talegjenkjenning, talesentriske dialogsystemer og anvendelser for små, mobile enheter. I tillegg opprettholdes vår høye kompetanse innen talesyntese og talekompresjon.

Med talesentriske systemer mener vi systemer hvor tale inngår som den viktigste modaliteten, men hvor vi også kan benytte andre modaliteter som et alternativ eller for å utvide funksjonalitet og brukervennlighet  til systemet.

Et talebasert grensesnitt er viktig for å oppnå økt naturlighet og forbedret effektivitet i interaksjon mellom mennesker og digitale tjenester. Det vil også bidra til å oppnå målet om lik adgang og bruksmuligheter for alle, uavhengig av eventuelle funksjonshemninger. Vi er involvert i utviklingen av talegjenkjenningssystemer for norsk språk og talebaserte dialogsystemer innen begrensede domener.

I et talesentrisk dialogsystem for norsk kan mye av den basisteknologien som benyttes internasjonalt også anvendes for norsk. I tillegg kreves det mye forskning for effektivt å kunne utnytte de språkavhengige delene av et slikt system. Dette gjelder spesielt utnyttelsen av lingvistisk kunnskap og semantisk innhold i tekst, tale og dialoger. Vokabular, uttaleformer og dialekter er også viktige faktorer.

Komponentene i et  talesentrisk dialogsystem for det norske språk dekker i stor grad den flerfaglige forskningsaktiviteten vi er involvert i:

  • Robust talegjenkjenning for å håndtere støy fra omgivelsene.
  • Robust talegjenkjenning for å håndtere menneskegenerert støy (pust, smatt, host, nøling, mm.), dialekt- og talervariasjoner, samt variasjoner i terminalutstyr og overføringskanal.
  • Lingvistisk og semantisk analyse for å bedre gjenkjenningsraten og trekke ut meningsinnholdet i en gjenkjent tekst.  
  • Dialoghåndtering for å generere tekstprompter for manglende informasjon, svar på forespørsler, informasjonsverifikasjon og feilhåndtering.
  • System som konverterer tekstprompter til talte responser.
  • Implementering i små mobile enheter og integrasjon av tjenester i trådbaserte og trådløse nettverk.
  • Integrering av andre modaliteter enn tale (f.eks. trykkfølsom skjerm).

I vår nåværende og framtidige aktivitet fokuserer vi på "design for alle", dvs. at databaserte systemer bør være aksesserbare for alle grupper i samfunnet, inkludert barn, eldre og funksjonshemmede. Dette betyr at det vil være viktig å utforme enkle, intuitive og multimodale brukergrensesnitt.

Kontaktperson:
Erik Harborg
Tlf.: 73 59 31 39


Publisert 11. januar 2008