Språkteknologi
Språkteknologi er teknologi som rettar seg mot eller tar i bruk menneskeleg språk. Nemninga datalingvistikk er brukt om sentrale teoriar og metodar innanfor språkteknologi, som er til hjelp når ein skal kjenne att, analysere og generere språk. Språkteknologi er tverrvitskapleg, og det høyrer heime m.a. under informatikk, dokumentasjonsvitskap og lingvistikk.
Bruksområde for språkteknologien
endreSpråkteknologien tar i bruk datalingvistiske metodar og utviklar dei til ulike bruksområde, m.a.
- bruk av naturleg språk i datamaskinen sitt brukargrensesnitt,
- til å handsame informasjonen i dokumentar og anna tekst, informasjonssøk, dokumentsøk, automatisk indeksering av tekst, genereringa av automatisk samandrag og dokumentklassifisering,
- ulike skriveverktøy, slik som retteprogram, grammatikkontrollprogram, automatisk stavingsinndeling og tesaurusar,
- ulike omsetjingshjelpeprogram som bruker språkteknologi, og maskinomsetjingsprogram, og ulike terminologiverkty,
- talesyntese og automatisk taleattkjenning,
- datastøtta språklæring (CALL) og
- utarbeiding av ordbøker og opplæringsmateriell, og program for å vurdere og betre lesbarheita til tekstar.
Metodar og delområde innanfor språkteknologien
endre- Preprosessering av tekst: Konvertering av teiknsett og filformat, segmentering av tekst i einskildord.
- Automatisk morfologisk analyse (morfologisk oppdeling), dvs. attkjenning av leksem og grammatisk ord, medrekna analyse av ukjende ord.
- Morfologisk generering (automatisk bøying).
- Automatisk syntaktisk analyse (syntaktisk oppdeling).
- Generering av naturleg språk (når datamaskina reknar ut svar på spørsmål, skal desse svara gjerast om til naturleg språk).
- Dialog-simulering (kva datamaskina bør seie i ein kvar situasjon).
- Attkjenning av språkfeil og framlegg til retting.
- Attkjenning av ulike tydingar av det same ordet i løpande tekst, t.d. når rekning tyder «matematisk oppgåve», når det tyder «pengesum som skal betalast», osb.)
- Antesedentar til anaforar (eller kva pronomen eller andre referensielle uttryk viser til innanfor same tekst)
- Oppsporing av termar i ein tekst (t.d. for å automatisk generere saksregister til ein tekst).
- I taleattkjenning å skilje tale frå pause, å skilje tale frå andre lydar (FFT, Cepstr, osb), attkjenning av dei mest sannsynlege orda i ein viss kontekst med hjelp av statistiske metodar (som t.d. HMM).
- I talesyntese lydmodellar (t.d. difonar) og kombinering av dei, og bruk av prosodisk modellering av difonstrengane.
Norske språkteknologiske føretak
endre- Kaldera språkteknologi AS, maskinomsetjing
- LingIT (lingit.no), utviklar av m.a. skrivehjelp for dyslektikarar
- Nynodata (nynodata.no), m.a. omsetjing mellom nynorsk og bokmål
- CognIT (cognit.no) driv med informasjonuthenting for norske tekster
- Tansa (tansasystems.com), tenarbasert grammatikk- og stavekontroll av bokmål og nynorsk
- Include (include.no), utviklar av m.a. skrivehjelp for dyslektikarar i samarbeid med Aksis (aksis.uib.no Arkivert 2008-12-11 ved Wayback Machine.)
- Metanet har ei liste over norske føretak som er med i Multilingual Europe Technology Alliance
Litteratur
endre- James Allen: Natural Language Understanding. Redwood City, CA: The Benjamin/Cummings Publishing Company, Inc., 1995.
- Daniel Jurafsky, James H. Martin: Speech and Language Processing - An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition, 2. utgave. Upper Saddle River, New Jersey: Prentice Hall, 2009.
- Kai-Uwe Carstensen et al. (Hrsg.): Computerlinguistik und Sprachtechnologie. Berlin: Spektrum Akademischer Verlag, 2001.
- Christopher D. Manning, Hinrich Schütze: Foundations of Statistical Natural Language Processing. Cambridge/MA: MIT Press, 1999.
Bakgrunnsstoff
endre- NORDOKNET dokumentasjonssenter for nordisk språkteknologi, som bind saman eit nett av tilsvarande dokumentasjonssentera i dei ulike nordiske landa.
- Norskdok Arkivert 2008-06-22 ved Wayback Machine., det norske dokumentasjonssenteret for språkteknologi
- Dandokcenter det danske dokumentasjonssenteret for språkteknologi
- FILT det finske dokumentasjonssenteret for språkteknologi.
- sprakteknologi.se Arkivert 2007-09-28 ved Wayback Machine. det svenske dokumentasjonssenteret for språkteknologi
- Language Technology World, nettstad med informasjon om språkteknologi rundt om i verda, med lister over språkteknologar, prosjekt, program, firma og organisasjonar som arbeider med språkteknologi.
- ACL The Association for Computational Linguistics, den viktigaste internasjonale organisasjonen innanfor dette området.