Føringsgrammatikk
Føringsgrammatikk, engelsk, Constraint Grammar (CG), svensk restriktionsgrammatik, finsk rajoitekielioppi er eit metodologisk paradigme for analyse av naturlege språk. Føringsgrammatikken tar utgangspunkt i ein fleirtydig grammatisk analyse, der kvar ordform har alle moglege analyser. Lingvistar skriv så reglar som vel rett analyse, ut i frå konteksten ordet står i (= legg føringar på kva analyse vi kan ha). Regelsettet er kompilert til ein grammatikk som vel rett analyse. Input-analysen kan vere av ulik slag, og representere morfologi, syntaks, dependens, valens, semantikk, osb. Reglane legg til, fjernar eller erstattar analyser, etter kontekst. Konteksten kan vere definert lokalt (ein eller eit par posisjonar til høgre eller venstre for ordet), eller globalt (langt unna ordet). Kontekstvilkåra i same regel kan bli knytt saman, negert, eller blokkert av mellomliggande ord eller taggar. Ein føringsgrammatikk for eit språk består som regel av tusenvis av reglar, som blir applisert i rekkjefølgje, gruppevis. Innanfor kvar gruppe blir sikre reglar brukt før usikre. Ingen reglar kan fjerne den siste analysen til eit ord, slik at ein føringsgrammatikk alltid vil gje minst ein analyse av ei kvar setning.
Historikk
endreFøringsgrammatikkonseptet vart introdusert av Fred Karlsson i 1990 (Karlsson 1990, Karlsson et al. 1995), og det har etter det vorte skrive føringsgrammatikkar for fleire språk, som har oppnådd nøyaktigheits-F-skåre for ordklassedisambiguering på over 99%. Mange føringsgrammatikksystem har oppnådd F-skåre for syntaktiske funksjonar på 95-97%. Føringsgrammatikk kan bli brukt til å lage fulle syntaktiske trestrukturar med å legge til små frasestrukturgrammatikkar eller dependensgrammatikkar, og fleire trebankprosjekt har brukt føringsgrammatikk for automatisk analyse. Føringsgrammatikk har også vorte brukt i mange språkteknologiske program, som grammatikkontroll (m.a. for bokmål) og maskinomsetjing (m.a. for dansk-engelsk), og for ulike språkpar i Apertium-plattforma, og for interaktive pedagogiske program for samisk, jf. samisk språkteknologi.
Føringsgrammatikk er det einaste syntaktiske formalismen som har oppnådd gode nok resultat til å kunne utgjere byggesteinar i kommersielle språkteknologiske program.
Kompilatorar
endreFøringsgrammatikkar er maskinlesbare regelsett. For å gjere dei om til fungerande program trengst ein kompilator. For føringsgrammatikk er det tre generasjonar av kompilatorar, vanlegvis kalla CG1, CG2, CG3. CG1 refererer til Fred Karlssons originale kompilator, skrive i Lisp (jf. Karlsson 19990). Andre generasjons kompilatorar vart utvikla av Pasi Tapanainen og skrive i C. Den viktige metodologiske nyvinninga var innføring av operatoren BARRIERE, som gjorde det lettare å lage reglar med fleksible kontekstar.
Føringsgrammatikk
endreFøringsgrammatikk kan velje mellom ulike analyser (disambiguering), og legge til nye analyser (tilordning).
Disambiguering
endreTilordning
endreListe over føringsgrammatikksystem sortert etter språk
endre- Baskisk [1] Arkivert 2009-12-15 ved Wayback Machine.
- Dansk DanGram
- Enaresamisk giella-smn
- Engelsk ENGCG Arkivert 2006-09-02 ved Wayback Machine., ENGCG-2 Arkivert 2006-05-20 ved Wayback Machine., VISL-ENGCG
- Esperanto EspGram
- Estisk [2]
- Finsk, t.d. giella-fin
- Fransk FrAG
- Færøysk giella-fao
- Irsk online Arkivert 2016-03-03 ved Wayback Machine.
- Italiensk ItaGram
- Katalansk CATCG Arkivert 2006-05-25 ved Wayback Machine.
- Lulesamisk giella-smj
- Nordsamisk giella-sme, documentation
- Norsk Oslo-Bergen tagger (kjeldekode Arkivert 2010-04-14 ved Wayback Machine.), giella-nob
- Portugisisk PALAVRAS
- Spansk HISPAL
- Svensk SWECG Arkivert 2007-02-05 ved Wayback Machine.
- Swahili
- Sørsamisk giella-sma
- Tysk GerGram
Litteratur
endre- Bick, Eckhard. 2000. The Parsing System "Palavras": Automatic Grammatical Analysis of Portuguese in a Constraint Grammar Framework. Aarhus: Aarhus University Press. ISBN 87-7288-910-1.
- Karlsson, Fred. 1990. Constraint Grammar as a Framework for Parsing Unrestricted Text. H. Karlgren, ed., Proceedings of the 13th International Conference of Computational Linguistics, Vol. 3. Helsinki 1990, 168-173.
- Karlsson, Fred, Atro Voutilainen, Juha Heikkilä, and Arto Anttila, editors. 1995. Constraint Grammar: A Language-Independent System for Parsing Unrestricted Text. Natural Language Processing, No 4. Mouton de Gruyter, Berlin and New York. ISBN 3-11-014179-5.
- Tapanainen, Pasi and Atro Voutilainen 1994: Tagging accurately: don't guess if you know. ANLC '94 Proceedings of the fourth conference on Applied natural language processing.