Isiklikud vahendid
Oled siin: Algus EKT projektid Kõne ja teksti emotsionaalsuse statistilised mudelid Projektist lähemalt

Projektist lähemalt

1. Kirjaliku teksti polaarsuse määraja

Eesmärgiks on seatud mis tahes kirjaliku teksti  lõikude positiivsuse, negatiivsuse ja neutraalsuse tuvastamine.

 

2011. aasta tulemus - Versioon 0.3 vt Emotsioonidetektor

Dokumentatsioon

vali: User Interface, anonymous users, applications

 

Emotsioonidetektor annab hinnangu kirjaliku teksti ortograafilise lõigu emotsionaalsuse kohta: näitab, kas lõik on positiivne, negatiivne, neutraalne või emotsionaalsuselt vastuoluline.

Hinnangu andmisel kasutab detektor võtmesõnu, milleks on kõige sagedamad eesti keele emotsioonisõnad. Võtmesõnade loendi loomine, katsetamine ja täiendamine oli üks 2011. a ülesandeid. Praegu on kasutusel 1347 võtmesõna: 617 positiivset ja 730 negatiivset (neist 468 nimisõna, 158 tegusõna, 333 omadussõna, 388 muutumatut sõna).

Läbi on viidud kaks ajakirjandustekstide lõikudest koostatud testi domineeriva lugejahinnangu saamiseks ning kõrvutatud tulemust detektori poolt lõigule antud hinnanguga. Testitud 134 lõigu puhul kattus lugeja- ja detektorihinnang 74% juhtudest, mis on päris hea tulemus, kui võrrelda seda seni teadaolevalt parima õige tuvastuse protsendiga 81,5, mis on saavutatud samuti suhteliselt väikest võtmesõnade hulka (5042) kasutava Semantic Orientation CALculator’iga (Taboada jt 2011).

Järgmised ülesanded:

Parandada emotsioonidetektori tuvastuse kvaliteeti:

 

  • salvestada eri žanris tekstilõigud korpusesse ja läbi viia testid lõikudele lugejahinnangu saamiseks.
  • korrigeerida võtmesõnade loendit (lisada sõnu või neid vajadusel välja võtta), lisada võtmesõnadele intensiivsus, lisada leksikaalsetel kimpudel põhinev tuvastus.

 Luua emotsioonidetektori moodul ühe veebibrauseri jaoks.


2. Emotsionaalsuse määramine kõnes


Kõnelejakohase emotsionaalsuse tuvastaja loomiseks on analüüsitud emotsionaalse kõne korpuse materjalil emotsioonide akustikat (spektrit, intensiivsust, põhitooni, kõnetempot), leitud emotsioone eristavad karakteristikud.

Statistiliste mudelite treenimiseks on korpust laiendatud polaarsuseinfoga:

Läbi on viidud 28 testi korpuse lausete polaarsuse (negatiivne, positiivne, neutraalne) määramiseks. Korpusesse on lisatud kombineeritud päring: emotsionaalne valents + emotsioonikategooria, vt Valents

 

2011. aasta üks ülesanne oli analüüsida olemasolevaid vabavaralisi emotsioonituvastajaid ja leida projekti teostamiseks sobiv.
Vabavaralistest kõneemotsiooni tuvastajatest langes valik OpenSMILE'ile openSMILE  , kuna see tarkvaraplatvorm on end õigustanud mitmes EL-i rahastatud projektis ja on jätkuvalt aktiivselt arendatav. OpenSMILE’i üks edukamaid käimasolevaid projekte on emotsionaalse suhtleja loomisele orienteeritud SEMAINE . OpenSMILE on lihtsalt laiendatav ja reaalajalisele statistilisele kõnetöötlusele orienteeritud. Meie projekti tarkvara loomist lihtsustab OpenSMILe’i valmis kõnetöötlusmoodulite lai valik; reaalajas akustiliste andmete töötlemine vähendab oluliselt meie korpuse andmemudelis salvastatavate andmete hulka.

Järgmised ülesanded:

 Luua korpuse materjali põhjal OpenSMILE'i platvormil töötav emotsioonituvastaja.

 

Lähtekood ja dokumentatsioon

 

Emotsionaalse kõne korpuses eraldada testikeskkond ja arenduskeskkond ning teha lähtekood ja dokumentatsioon avalikult kättesaadavaks repositooriumi kaudu.

Tegevused dokumentidega