Dissertação

Say Something Smart - ensinando um chatbot a responder com base em legendas de filmes EVALUATED

Os sistemas de diálogo são sempre confrontados com utilizadores que tentam ultrapassar os limítes do seu conhecimento, ou por desconhecimento das suas limitações, ou simplesmente para testar a capacidade do sistema. Estas interacções são consideradas fora do domínio. É impossível prever todos os possíveis inputs a que um agente conversacional pode ser submetido, mas tendo em conta que “se um dado input aparece uma vez, há uma probabilidade não nula de aparecer novamente mais tarde”, a ideia de tirar vantagem de interacções humanas existentes para alimentar um sistema de diálogo surge naturalmente. Neste trabalho, focamos as nossas atenções em diálogos existentes em legendas. Assim, recolhemos legendas de diferentes filmes e desenvolvemos um algoritmo capaz de extrair os diálogos das mesmas, criando um corpus formado por um conjunto de pares Interacção-Resposta (I-R). No que respeita à correcção do corpus obtido, uma avaliação preliminar revelou um elevado recall (97%) mas uma precisão um pouco mais baixa (71%). Para permitir a sua utilização num agente conversacional e dado que o sistema existente não conseguia lidar com um número tão elevado de pares Interacção-Resposta, desenvolvemos duas estratégias: A primeira baseada no Lucene e a segunda baseada numa técnica chamada Locally Sensitive Hashing. A primeira foi a que apresentou os melhores resultados (para o corpus formado por todos os pares I-R obtidos a partir de legendas em inglês), sendo capaz de responder correctamente a 46,5% das interacções a que foi submetida.
Legendas, Diálogos, Par Interacção-Resposta, Interacções Fora do Domínio

Novembro 6, 2013, 18:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar