Føringsgrammatikk

Føringsgrammatikk, engelsk, Constraint Grammar (CG), svensk restriktionsgrammatik, finsk rajoitekielioppi er eit metodologisk paradigme for analyse av naturlege språk. Føringsgrammatikken tar utgangspunkt i ein fleirtydig grammatisk analyse, der kvar ordform har alle moglege analyser. Lingvistar skriv så reglar som vel rett analyse, ut i frå konteksten ordet står i (= legg føringar på kva analyse vi kan ha). Regelsettet er kompilert til ein grammatikk som vel rett analyse. Input-analysen kan vere av ulik slag, og representere morfologi, syntaks, dependens, valens, semantikk, osb. Reglane legg til, fjernar eller erstattar analyser, etter kontekst. Konteksten kan vere definert lokalt (ein eller eit par posisjonar til høgre eller venstre for ordet), eller globalt (langt unna ordet). Kontekstvilkåra i same regel kan bli knytt saman, negert, eller blokkert av mellomliggande ord eller taggar. Ein føringsgrammatikk for eit språk består som regel av tusenvis av reglar, som blir applisert i rekkjefølgje, gruppevis. Innanfor kvar gruppe blir sikre reglar brukt før usikre. Ingen reglar kan fjerne den siste analysen til eit ord, slik at ein føringsgrammatikk alltid vil gje minst ein analyse av ei kvar setning.

Historikk

endre

Føringsgrammatikkonseptet vart introdusert av Fred Karlsson i 1990 (Karlsson 1990, Karlsson et al. 1995), og det har etter det vorte skrive føringsgrammatikkar for fleire språk, som har oppnådd nøyaktigheits-F-skåre for ordklassedisambiguering på over 99%. Mange føringsgrammatikksystem har oppnådd F-skåre for syntaktiske funksjonar på 95-97%. Føringsgrammatikk kan bli brukt til å lage fulle syntaktiske trestrukturar med å legge til små frasestrukturgrammatikkar eller dependensgrammatikkar, og fleire trebankprosjekt har brukt føringsgrammatikk for automatisk analyse. Føringsgrammatikk har også vorte brukt i mange språkteknologiske program, som grammatikkontroll (m.a. for bokmål) og maskinomsetjing (m.a. for dansk-engelsk), og for ulike språkpar i Apertium-plattforma, og for interaktive pedagogiske program for samisk, jf. samisk språkteknologi.

Føringsgrammatikk er det einaste syntaktiske formalismen som har oppnådd gode nok resultat til å kunne utgjere byggesteinar i kommersielle språkteknologiske program.

Kompilatorar

endre

Føringsgrammatikkar er maskinlesbare regelsett. For å gjere dei om til fungerande program trengst ein kompilator. For føringsgrammatikk er det tre generasjonar av kompilatorar, vanlegvis kalla CG1, CG2, CG3. CG1 refererer til Fred Karlssons originale kompilator, skrive i Lisp (jf. Karlsson 19990). Andre generasjons kompilatorar vart utvikla av Pasi Tapanainen og skrive i C. Den viktige metodologiske nyvinninga var innføring av operatoren BARRIERE, som gjorde det lettare å lage reglar med fleksible kontekstar.

Føringsgrammatikk

endre

Føringsgrammatikk kan velje mellom ulike analyser (disambiguering), og legge til nye analyser (tilordning).

Disambiguering

endre

Tilordning

endre

Liste over føringsgrammatikksystem sortert etter språk

endre

Litteratur

endre