Språkteknologi er teknologi som rettar seg mot eller tar i bruk menneskeleg språk. Nemninga datalingvistikk er brukt om sentrale teoriar og metodar innanfor språkteknologi, som er til hjelp når ein skal kjenne att, analysere og generere språk. Språkteknologi er tverrvitskapleg, og det høyrer heime m.a. under informatikk, dokumentasjonsvitskap og lingvistikk.

Bruksområde for språkteknologien

endre

Språkteknologien tar i bruk datalingvistiske metodar og utviklar dei til ulike bruksområde, m.a.

Metodar og delområde innanfor språkteknologien

endre
  • Preprosessering av tekst: Konvertering av teiknsett og filformat, segmentering av tekst i einskildord.
  • Automatisk morfologisk analyse (morfologisk oppdeling), dvs. attkjenning av leksem og grammatisk ord, medrekna analyse av ukjende ord.
  • Morfologisk generering (automatisk bøying).
  • Automatisk syntaktisk analyse (syntaktisk oppdeling).
  • Generering av naturleg språk (når datamaskina reknar ut svar på spørsmål, skal desse svara gjerast om til naturleg språk).
  • Dialog-simulering (kva datamaskina bør seie i ein kvar situasjon).
  • Attkjenning av språkfeil og framlegg til retting.
  • Attkjenning av ulike tydingar av det same ordet i løpande tekst, t.d. når rekning tyder «matematisk oppgåve», når det tyder «pengesum som skal betalast», osb.)
  • Antesedentar til anaforar (eller kva pronomen eller andre referensielle uttryk viser til innanfor same tekst)
  • Oppsporing av termar i ein tekst (t.d. for å automatisk generere saksregister til ein tekst).
  • I taleattkjenning å skilje tale frå pause, å skilje tale frå andre lydar (FFT, Cepstr, osb), attkjenning av dei mest sannsynlege orda i ein viss kontekst med hjelp av statistiske metodar (som t.d. HMM).
  • I talesyntese lydmodellar (t.d. difonar) og kombinering av dei, og bruk av prosodisk modellering av difonstrengane.

Norske språkteknologiske føretak

endre

Litteratur

endre
  • James Allen: Natural Language Understanding. Redwood City, CA: The Benjamin/Cummings Publishing Company, Inc., 1995.
  • Daniel Jurafsky, James H. Martin: Speech and Language Processing - An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, 2. utgave. Upper Saddle River, New Jersey: Prentice Hall, 2009.
  • Kai-Uwe Carstensen et al. (Hrsg.): Computerlinguistik und Sprachtechnologie. Berlin: Spektrum Akademischer Verlag, 2001.
  • Christopher D. Manning, Hinrich Schütze: Foundations of Statistical Natural Language Processing. Cambridge/MA: MIT Press, 1999.

Bakgrunnsstoff

endre
  • NORDOKNET dokumentasjonssenter for nordisk språkteknologi, som bind saman eit nett av tilsvarande dokumentasjonssentera i dei ulike nordiske landa.
  • Language Technology World, nettstad med informasjon om språkteknologi rundt om i verda, med lister over språkteknologar, prosjekt, program, firma og organisasjonar som arbeider med språkteknologi.
  • ACL The Association for Computational Linguistics, den viktigaste internasjonale organisasjonen innanfor dette området.