Dissertação

QA+ML@Wikipedia&Google EVALUATED

À medida que a quantidade de informação textual disponível na World Wide Web aumenta, torna-se cada vez mais difícil para o utilizador comum encontrar informação específica de uma maneira conveniente. Por exemplo, encontrar a resposta para uma pergunta simples como "Quem é o homem mais alto do mundo?" pode-se tornar numa tarefa fastidiosa. Os sistemas de pergunta resposta (question answering, em Inglês) oferecem uma solução para este problema, permitindo obter rapidamente respostas sucintas para perguntas colocadas em língua natural. No entanto, a construção destes sistemas exige tipicamente uma quantidade considerável de trabalho moroso, e sujeito a erros humanos, resultando em sistemas caros e difíceis de adaptar para novos domínios. Para lidar com estes problemas, nesta tese, propomos uma abordagem multi-facetada para question answering na Web, com particular foco em técnicas de aprendizagem automática, que permitem ao sistema aprender regras, ao invés de ter um perito humano a criá-las manualmente. Em particular, propomos um sistema composto por três componentes: classificação de perguntas, recuperação de passagens, e extracção de respostas. Para o primeiro componente, desenvolvemos um classificador baseado em técnicas de aprendizagem automática, que utiliza um conjunto de features lexicais, sintácticas, e semânticas. Para a recuperação de passagens, empregamos uma abordagem multi-estratégia, que selecciona a fonte de informação apropriada, dependendo do tipo da pergunta. Finalmente, para a extracção de respostas, foram utilizadas diversas técnicas de extracção, desde simples expressões regulares, a técnicas de aprendizagem automática. O sistema foi avaliado com perguntas feitas por potenciais utilizadores do sistema, tendo-se obtido resultados muito prometedores.
Sistemas de pergunta resposta, Aprendizagem automática, Processamento de língua natural, World Wide Web

Novembro 9, 2009, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Andreas Miroslaus Wichert

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar