Dissertação

{en_GB=Assessing MOOCs Discussion Forums} {} EVALUATED

{pt=Com a recente popularidade dos MOOCs, os instrutores destes cursos enfrentam agora o problema de ter de escolher, de entre as centenas de posts dos fóruns dos seus cursos, os que precisam de resposta mais imediata. Nesta tese usamos técnicas das áreas de Análise de Sentimentos e Processamento de Língua Natural para classificar/extrair informação destes posts, com o objetivo futuro de contribuir para esta escolha. Num primeiro estudo, desenvolvemos um modelo de classificação que nos permite iden- tificar se uma mensagem pertence a um instrutor ou estudante. Os melhores resultados do cálculo da F-measure (80.76% para categoria estudante e 80.38% para categoria instrutor) foram obtidos usando unigramas como features e tendo usado um stemmer sobre os posts. O segundo estudo visou a im- plementação de um classificador que devolve a polaridade de um post com base na polaridade dos seus termos, tal como definida no léxico SenticNet. Os melhores resultados obtidos no cálculo da F- measure foram de 74.6% na identificação de termos positivos batendo os resultados do SentiStrength e de 38.3% na identificação de termos negativos. Finalmente, num terceiro estudo identificámos as expressões mais frequentes por parte de instrutores e estudantes, bem como os termos mais comuns aos diferentes e específicos cursos. Concluímos que existem de facto expressões específicas e que podem ser úteis na identificação de instrutores e estudantes, bem como a diferentes cursos., en=With the recent popularity of Massive Open Online Courses (MOOCs), instructors of these courses now face the problem of having to choose from among the hundreds of posts from forums of their courses, who need more immediate response. In this thesis we use techniques from the fields of Sentiment Analysis and Natural Language Processing to classify / extract information from these posts, with the future goal of contributing to this choice. In a first study, we developed a classification model that allows us to identify whether a message belongs to an instructor or student. The best F-measure (F1) results (80.76 % for student category and 80.38 % for instructor category) were obtained using unigrams as features and having used a stemmer on the posts. The second study aimed at implementing a classifier that detects the polarity of a post based on the polarity of their terms, as defined in SenticNet lexicon. The best F-measure (F1) results were 74.6 % in the identification of positive terms beating the results of SentiStrength, and 38.3 % in the identification of negative terms. Finally, a third study identified the most frequently used expressions by instructors and students as well as the most common terms to the different and specific courses. We concluded that there are in fact specific expressions that could help in the identification of students and instructors as well as for the different courses.}
{pt=Cursos Online, estudantes, instrutores, polaridade, fóruns de discussão, mensagens., en=MOOCs, student, instructor, polarity, discussion forums, posts.}

Novembro 13, 2015, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar