FenixEdu™

Dissertação

Making Predictions With Textual Contents EVALUATED

Detalhes: A previsão de quantidades do mundo real com base em informação proviniente de descrições textuais atraiu recentemente um interesse significativo enquanto problema de investigação, embora os estudos anteriores na área se tenham concentrado em aplicações que envolvem apenas textos no idioma Inglês. Este documento apresenta um estudo experimental sobre a realização de previsões com base em conteúdos textuais escritos em Português, envolvendo o uso de documentos associados a três domínios distintos. Eu relato especificamente experiências utilizando diferentes tipos de modelos de regressão, usando esquemas de pesagem para as características do actual estado da arte, e usando características derivadas de representações para as palavras baseadas no agrupamento automático das mesmas. Através de experiências controladas, desmonstrei que modelos preditores usando informação textual atingem melhores resultados, quando comparados com abordagens simples tais como realizar as previsões com base no valor médio dos dados de treino. Demonstrei ainda que as representações de documentos mais ricas (ou seja, usando o algoritmo de Brown para o agrupamento automático de palavras, e o esquema de pesagem das características denomindo Delta-TF-IDF) resultam em ligeiras melhorias no desempenho.
Keywords: Previsões com Base em Texto, Modelos de Regressão, Agrupamento Automático, Engenharia de Caracteristicas

Discussão: maio 7, 2014, 13:30