2007. aasta tulemused
2007. aasta põhitulemused: seosed süntaksi projektiga, semantiliste rollide süsteem, freimiformaat, ressursid.
Seos süntaksiga
Olulisim on süstemaatilise seose sisseseadmine süntaksi projektiga, mis annab välja lihtlausete süntaktilised puud. Nende põhjal koostame lausete semantilised freimiesitused, kus lausete süntaktilised komponendid saavad omale semantilised rollid.
Semantilised rollid
Eristame u 20 erinevat semantilist rolli. Loend ei ole lõplik, sest keerulisemate lausestruktuuride ja tekstistruktuuride juurde liikumisel võivad need muutuda. On läbi töötatud semantiliste rollide tüübid. Näiteks lisaks lauses aktuaalselt (süntaktiliselt) realiseeritud elementidele esinevad ka nn varjatud või default elemendid nagu silmad- > vaatama või jalad- > kõndima, sest need võivad osutuda relevantseks, kui neil on täiend (vaatas kurbade silmadega) või kui minnakse elementaarsetest lihtlausetest kaugemale (nt kõrvallaused, tekst) (nt Vaatas…X, silmad väsisid ära. ). See problemaatika on käsitletav ühe järeldatava info tüübina.
Freimi formaat
Freimileksikoni põhiühikuks on Freim. Iga freimi kohta esitatakse järgmine info:
- Lemma. Freimi moodustava verbi lemma (märksõna).
- Tähendus. String, mis määrab fremi tähenduse. Kui verb oma tähendusega esineb Eesti WordNetis, siis selle tähendusnumber.
- Hüperonüüm. Tüüpiliselt ei seisa siin mitte vahetu hüperonüüm, vaid antud hüperonüümiahierarhia ülemmõiste (millel endal pole rohkem hüperonüüme).
- Hüperonüümi tähendus. Hüperonüümi tähendusnumber Eesti WordNetis.
- Rollid (ehk freimi elemendid). Iga freimi element sisaldab rolli
nime ja vähemalt ühte kasutusnäidet. Kasutusnäitete struktuur on
järgmine:
- Fraas. Fraas, millele on omistatud Roll.
- Lause. Näitelause, millest Fraas pärit on.
- Allikas. Näitelause allikaviide (alakorpus).
