RTEK loomisel korduvkasutatavad ressursid
Loetelu RTEK loomisel korduvkasutatavatest ressurssidest (projektid, tarkvaraplatvormid, artiklid jms).
- UNL http://www.unlweb.net
- GF http://www.grammaticalframework.org
- ACE http://attempto.ifi.uzh.ch/site/docs
- PENG Processable English ja selle laiendused, nt PENG-D http://web.science.mq.edu.au/~rolfs/peng
- Ordnance Survey’s Rabbit http://www.ordnancesurvey.co.uk/ontology, http://www.ordnancesurvey.co.uk/oswebsite/partnerships/research/publications/docs/2007/Rabbit_Language_v1.pdf
- CLOnE: Controlled Language for Ontology Editing
- Sydney OWL Syntax (SOS)
- Common Logic Controlled English
(J. F. Sowa http://www.jfsowa.com/clce/specs.htm) - Boeing’s Computer-Processable Language
- AECMA Simplified English (The European Association of Aerospace Industries)
Neist kaardistatud RTEK omadustega ja kasutuslugude realiseerimiseks on sobivaimad UNL ja GF, eelkõige arvestades mitmekeelsuse toe ja üldisemate kui FOL-põhiste tekstide tuge.
CNL-alased allikad, artiklid:
- CNL Workshop published CEUR pre-proceedings of extended abstracts CNL 2009: sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-448
- CNL 2010: sunsite.informatik.rwth-aachen.de/Publications/CEUR-WS/Vol-622
- CNL Workshop Springer LNAI proceedings of full papers CNL 2009:
www.springer.com/computer/ai/book/978-3-642-14417-2 - Rolf Schwitter and Marc Tilbrook. Controlled Natural Language meets the Semantic Web. Proceedings of the Australasian Language Technology Workshop 2004. Macquarie University, Sydney, December 8th, 2004. pp 55-62.
- T. Mitamura. 1999. Controlled Language for Multilingual Machine Translation. Invited paper. In: Proceedings of Machine Translation Summit VII. Singapore, September 13-17.
- Rolf Schwitter, Kaarel Kaljurand, Anne Cregan, Catherine Dolbear, and Glen Hart. A Comparison of three Controlled Natural Languages for OWL 1.1
Allikates tuleb nimetada veel mitmeid CNL kogukonna ühiseid töökeskkondi (nt wiki http://cnl.wikia.com/wiki/Controlled_Natural_Languages_Wiki
ja mitmed google-dokumendid), mis paraku ei ole 2010 lõpu seisuga "elavad".
Eesti keeleressurssidest on korduvkasutatavad Eesti Wordnet/Teksaurus ja selle põhjal transformeeritud OWL-kujul Eesti üldontoloogia -- alusena sõnavarale.
Grammatilised struktuurid tuleb platvormidele UNL ja GF defineerida nullist -- kasutada saab edukalt (paberkujul) Eesti keele käsiraamatut (2007) ja Eesti keele sõnaraamatut (ÕS 2006).
Seisuga november 2010 ei andnud korduvkasutatavaid resursse otsing CLARIN-andmebaasist. RTEK esitlusviis sõltub suuresti valitavast "pookealusest" (vt eespool projektid ja tarkvaraplatvormid) -- nt GF puhul on selleks Abstract Structure, UNLis vastavalt UNL spetsifikatsioonile (http://www.unlweb.net/wiki/index.php/Specs).Nimetame siin veel võimalusi:
- OWL
- DRS -- discourse representation structures (Fuchs, N.E., Kaljurand, K., Kuhn, T.: Discourse representation structures for ACE 6.0. Department of Informatics, University of Zurich, Zurich (2008))
- Rhetorical Structure Theory
Nimekirja on valitud ressursid, millised haakuvad RTEK kasutuslugudega ja omadustega, kindlasti ei ole tegu ammendava loeteluga.
Täiendused on teretulnud martin.luts[at]eesti.ee.
