Projektist lähemalt
Eesmärgiks on seatud mis tahes kirjaliku teksti lõikude positiivsuse, negatiivsuse ja neutraalsuse tuvastamine.
2011. aasta tulemus - Versioon 0.3 vt Emotsioonidetektor
Dokumentatsioonvali: User Interface, anonymous users, applications
Emotsioonidetektor annab hinnangu kirjaliku teksti ortograafilise lõigu
emotsionaalsuse kohta: näitab, kas lõik on positiivne, negatiivne, neutraalne
või emotsionaalsuselt vastuoluline.
Hinnangu andmisel kasutab detektor
võtmesõnu, milleks on kõige sagedamad eesti keele emotsioonisõnad. Võtmesõnade
loendi loomine, katsetamine ja täiendamine oli üks 2011. a ülesandeid. Praegu on
kasutusel 1347 võtmesõna: 617 positiivset ja 730 negatiivset (neist 468
nimisõna, 158 tegusõna, 333 omadussõna, 388 muutumatut sõna).
Läbi on viidud kaks ajakirjandustekstide lõikudest koostatud
testi domineeriva lugejahinnangu saamiseks ning kõrvutatud tulemust detektori
poolt lõigule antud hinnanguga. Testitud 134 lõigu puhul kattus lugeja- ja
detektorihinnang 74% juhtudest, mis on päris hea tulemus, kui võrrelda seda seni
teadaolevalt parima õige tuvastuse protsendiga 81,5, mis on saavutatud samuti
suhteliselt väikest võtmesõnade hulka (5042) kasutava Semantic Orientation
CALculator’iga (Taboada jt 2011).
Järgmised ülesanded:
Parandada emotsioonidetektori tuvastuse kvaliteeti:
- salvestada eri žanris tekstilõigud korpusesse ja läbi viia testid lõikudele lugejahinnangu saamiseks.
- korrigeerida võtmesõnade loendit (lisada sõnu või neid vajadusel välja võtta), lisada võtmesõnadele intensiivsus, lisada leksikaalsetel kimpudel põhinev tuvastus.
Luua emotsioonidetektori moodul ühe veebibrauseri jaoks.
2. Emotsionaalsuse määramine kõnes
Kõnelejakohase emotsionaalsuse tuvastaja loomiseks on analüüsitud emotsionaalse kõne korpuse materjalil emotsioonide akustikat (spektrit, intensiivsust, põhitooni, kõnetempot), leitud emotsioone eristavad karakteristikud.
Statistiliste mudelite treenimiseks on korpust laiendatud polaarsuseinfoga:
Läbi on viidud 28 testi korpuse lausete polaarsuse (negatiivne, positiivne, neutraalne) määramiseks. Korpusesse on lisatud kombineeritud päring: emotsionaalne valents + emotsioonikategooria, vt Valents
2011. aasta üks ülesanne oli analüüsida olemasolevaid vabavaralisi
emotsioonituvastajaid ja leida projekti teostamiseks sobiv.
Vabavaralistest
kõneemotsiooni tuvastajatest langes valik OpenSMILE'ile openSMILE , kuna see tarkvaraplatvorm on end õigustanud mitmes
EL-i rahastatud projektis ja on jätkuvalt aktiivselt arendatav. OpenSMILE’i üks
edukamaid käimasolevaid projekte on emotsionaalse suhtleja loomisele
orienteeritud SEMAINE . OpenSMILE on lihtsalt
laiendatav ja reaalajalisele statistilisele kõnetöötlusele orienteeritud. Meie
projekti tarkvara loomist lihtsustab OpenSMILe’i valmis kõnetöötlusmoodulite lai
valik; reaalajas akustiliste andmete töötlemine vähendab oluliselt meie korpuse
andmemudelis salvastatavate andmete hulka.
Luua korpuse materjali põhjal OpenSMILE'i platvormil töötav emotsioonituvastaja.
Lähtekood ja dokumentatsioon
Emotsionaalse kõne korpuses eraldada testikeskkond ja arenduskeskkond ning teha lähtekood ja dokumentatsioon avalikult kättesaadavaks repositooriumi kaudu.
