ABSAuDA - Análise de Sentimentos baseado em Aspectos utilizando Análise de Dependência
Abstract
A Análise de Sentimentos Baseada em Aspectos consiste em examinar opiniões, sentimentos, avaliações, apreciações, atitudes e emoções das pessoas em relação a entidades e seus aspectos, expressas em diferentes formatos, como texto, imagem,
áudio ou vídeo. As entidades podem ser, por exemplo, produtos e serviços, já os aspectos podem ser, por exemplo, preço e durabilidade de um produto ou serviço. Contudo, para realizar a Análise de Sentimentos Baseada em Aspectos é necessá rio utilizar recursos chamados de Recursos Linguísticos, que são usados para apoiar pesquisas e aplicações, como Conjuntos de Dados e Bases de Conhecimento Lin guístico. No entanto, em Linguagens de Poucos Recursos, como é o caso do por tuguês brasileiro, ocorre uma carência de recursos. Devido à insuficiência recursos existe uma escassez de métodos confiáveis para Linguagens de Poucos Recursos. Este trabalho propõe um sistema de Análise de Sentimentos Baseada em Aspectos,
empregando ontologias de domínio e análise de dependência sintática. Utilizou-se a ontologia Hontology, responsável por armazenar conceitos, relações e instâncias no domínio das acomodações, para identificar os aspectos relacionados com o sistema hoteleiro. Já a análise de dependência sintática é utilizada para identificar termos opi nativos relacionados aos aspectos. Além disso, o estudo incorporou o uso de diversos léxicos de sentimento (por exemplo, AffectPT-br, EmoLex, LeIA, LIWC2007pt, Onto.PT, OpLexicon, Reli-Lex, SentiLex-PT, SentiWordNet-PT-BR, UNILEX, WordNetAffectBR), que são responsáveis por armazenar a polaridade das palavras, e o uso do Ensemble Lex, ensemble dos resultados dos quatro melhores léxicos. Os testes foram realizados visando verificar a viabilidade do uso de correção ortográfica (manual e através das bi bliotecas autocorrect, pyspellchecker e LanguageTool) e do uso da moda da união dos adjetivos que estavam relacionados com um aspecto. Os resultados demonstraram que o EnsembleLex superou os resultados obtidos pelos outros léxicos, alcançando
um máximo de 0,461 para medida-f (macro) e 0,536 para medida-f (micro), usando reviews com anotações neutras quanto ao sentimento dirigido aos aspectos, a moda da união dos adjetivos e a biblioteca de correção ortográfica pyspellchecker.