Voci pentru România: interviu cu Alexandra Balahur
Autor: Anamaria Blănaru
Doctor european în domeniul Procesării Limbajului Natural, cu o intensă activitate ştiinţifică în cadrul European Joint Research Center şi organizator principal al workshop-ul internaţional Computational Approaches to Subjectivity Analysis, Alexandra Balahur este tânărul pentru care România nu este un subiect închis, atâta vreme cât o poate promova în activităţile sociale sau ştiinţifice.
Ştim că ai urmat cursurile unei facultăţi din România după care ai ales să îţi dezvolţi cariera de cercetător în afara ţării. Care au fost schimbările majore pe care le-ai simţit odată cu alegerea făcută?
Cele mai importante schimbări, cred eu, nu sunt legate de viaţa profesională. Este, în primul rând, greu să fii departe de casă, de cei dragi. E o provocare să te adaptezi unui nou mediu, cu o limba distinctă de a ta (chiar dacă o ştii), cu alte reguli şi alte obiceiuri. Nu mai eşti alături de prietenii de o viaţă şi de cunoscuţi. Trebuie să cunoşti noi oameni, să te integrezi în noi grupuri, să înţelegi „cum funcţionează” acea nouă societate în care trăieşti şi să te integrezi cât mai repede şi mai bine în ea. Eşti responsabil pentru absolut tot ceea ce ţi se întâmplă, iar această responsabilitate te maturizează foarte mult.
Din punct de vedere profesional, schimbarea cea mai mare a constituit-o stilul de lucru, orientat spre aplicaţie şi apariţia deadline-urilor.
Titlul de doctor european ţi s-a acordat în urma aprecierii internaţionale a tezei de doctorat. Care au fost elementele de inovaţie pe care le-a adus cercetarea ta în domeniul informaticii?
Cercetarea din cadrul tezei mele se încadrează domeniului Procesării Limbajului Natural, care este parte a disciplinei „Inteligenţă Artificială”, parte a Informaticii. Teza mea, intitulată „Methods and Resources for Sentiment Analysis in Multilingual Documents of Different Text Types”, propune şi evaluează algoritmi informatici pentru extragerea automată a sentimentelor exprimate în diferite tipuri de texte (articole de ziar, critici pe internet, blog-uri, forumuri, dezbateri politice), algoritmi bazaţi pe dicţionare şi metode statistice. Contribuţia tezei nu este doar în informatică, prin aceşti algoritmi propuşi şi evaluaţi (atât pe texte existente, cât şi în competiţii de specialitate), dar şi pe partea de analiză lingvistică a caracteristicilor acestor texte şi a modalităţilor prin care sentimentele sunt exprimate în cadrul lor, în diferite limbi. Pentru aplicarea algoritmilor menţionaţi, este nevoie de texte adnotate corespunzător, iar această analiză este singura modalitate prin care aceste texte pot fi corect etichetate şi utilizate. Mai mult, metodele propuse au fost aplicate în cadrul unor sisteme mai ample, ce rezumă automat opiniile exprimate în lanţurile de comentarii la post-uri din blog-uri şi la sisteme de tip întrebare-răspuns pentru opinii, care pot fi utilizate pentru a găsi cele mai relevante răspunsuri la întrebări de tipul „De ce preferă oamenii MacOS sistemului de operare Windows?” cautând în documente pe Internet.