Dissertação

{pt=The Answer Question in Question Answering Systems} {} EVALUATED

{pt=No mundo atual, os Sistemas de Pergunta Resposta tornaram-se uma resposta válida para o problema da explosão de informação da Web, uma vez que conseguem efetivamente compactar a informação que estamos à procura numa única resposta. Para esse efeito, um novo Sistema de Pergunta Resposta foi criado: Just.Ask. Apesar do Just.Ask já estar completamente operacional e a dar respostas corretas a um certo número de questões, permanecem ainda vários problemas a endereçar. Um deles é a identificação errónea de respostas a nível de extração e clustering, que pode levar a que uma resposta errada seja retornada pelo sistema. Este trabalho lida com esta problemática, e é composto pelas seguintes tarefas: a) criar corpora para melhor avaliar o sistema e o seu módulo de respostas; b) apresentar os resultados iniciais do Just.Ask, com especial foco para o seu módulo de respostas; c) efectuar um estudo do estado da arte em relações entre respostas e identificação de paráfrases de modo a melhorar a extração das respostas do Just.Ask; d) analizar erros e detectar padrões de erros no módulo de extração de respostas do sistema; e) apresentar e implementar uma solução para os problemas detectados. Isto incluirá uma normalização/integração das respostas potencialmente corretas, juntamente com a implementação de novas técnicas de "clustering"; f) avaliação do sistema com as novas adições propostas. , en=In today's world, Question Answering (QA) Systems have become a viable answer to the problem of information explosion over the web, since they eff ectively compact the information we are looking for into a single answer. For that e ffect, a new QA system called Just.Ask was designed. While Just.Ask is already fully operable and giving correct answers to certain questions, there are still several problems that need to be addressed. One of them is the erroneous identification of potential answers and clustering of answers, which can lead to a wrong answer being returned by the system. This work deals with this problem, and is composed by the following tasks: a) create test corpora to properly evaluate the system and its answers module; b) present the baseline results of Just.Ask, with special attention to its answers module; c) perform a state of the art in relating answers and paraphrase identi cation in order to improve the extraction of answers of Just.Ask; d) analyze errors and detect error patterns over the answer extraction stage; e) present and implement a solution to the problems detected. This will include normalization/integration of the potential answers as well as implementing new clustering techniques; f) Evaluation of the system with the new features proposed.}
{pt=Just.Ask, Sistema de Pergunta Resposta, relações entre respostas, extracção de respostas, corpus, clustering, en=Just.Ask, Question Answering, Relations between Answers, Clustering, Corpus, Answer Extraction}

novembro 9, 2011, 14:30

Orientação

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar