Dissertação

{pt=Answer Selection in Question/Answering} {} EVALUATED

{pt=Esta tese aborda o problema da selecção da resposta na área dos sistemas de Pergunta/Resposta. A selecção da resposta é uma das principais etapas destes sistemas, tendo como objectivo escolher a resposta a devolver com base num conjunto de candidatos. Para tal propomos o AnSelMo (ANSwering SELection MOdule), um módulo de selecção de resposta. A sua abordagem é baseada no contexto onde o candidato de resposta se encontra, medindo as distâncias entre os termos da pergunta e da resposta e usando medidas de similaridade para comparar passagens relacionadas com a pergunta com passagens relacionadas com a resposta. Outra abordagem explorada é baseada em espaços semânticos, usando Análise Semântica Latente. O AnSelMo foi testado em três cenários distintos: com dados do ?Quem Quer Ser Milionário? (WWBM), o famoso concurso de perguntas de escolha múltipla, no contexto da avaliação conjunta Question Answering for Machine Reading Evaluation (QA4MRE), uma tarefa de compreensão escrita do Cross Language Evaluation Forum, e no Just.Ask, o sistema de Pergunta/Resposta do L2F. Os resultados para o WWBM ultrapassam o estado da arte, enquanto que para o QA4MRE os resultados são melhores que grande parte dos obtidos pelos sistemas participantes em 2011. Também conseguimos melhorar a exactidão do Just.Ask, através da integração do AnSelMo., en=This thesis addresses the problem of answer selection in Question Answering (QA) systems. Answer selection is one of the main steps of those systems and has as goal to choose the answer to be returned based on a set of candidate answers. For that, we propose AnSelMo, an ANSwering SELection MOdule. Its approach is based on the context where candidate answers appear, by measuring distances between question and answer terms and by using similarity measures to compare passages related with the question with passages related with the answer. Another approach explored is based in Semantic Spaces, by using Latent Semantic Analysis. AnSelMo was tested in three different scenarios: in ?Who Wants to Be Millionaire?? (WWBM), the famous contest of multiple-answer questions, in Question Answering for Machine Reading Evaluation (QA4MRE), a Cross Language Evaluation Forum reading comprehension task, and with Just.Ask, the L2F QA system. Results for WWBM surpass the state of the art, while for QA4MRE results are better than most of the 2011 competing systems? results. We were also able to improve Just.Ask in terms of accuracy, by integrating AnSelMo on it.}
{pt=Pergunta/Resposta, Selecção de Resposta, Contexto, Proximidade de Palavras, Medidas de Similaridade, Espaços Semânticos, en=Question Answering, Answer Selection, Context, Word Proximity, Similarity Measures, Semantic Spaces}

Julho 16, 2012, 15:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar