Dissertação

{pt_PT=TalKit: Desenvolvimento de um sistema de diálogo para português} {} EVALUATED

{pt=Nesta tese propomos uma taxonomia para classificar as interações dadas por um utilizador a um sistema de diálogo e desenvolvemos o TalKit, que tem como objetivo responder a diferentes tipos de interações, escolhendo os módulos responsáveis pela resposta com base nessa taxonomia. Dois módulos existentes, o Say Something Smart e o Talkpedia foram usados neste processo, tendo o segundo sido estendido neste trabalho. Foram implementados vários classificadores que combinam regras escritas à mão e módulos criados com técnicas de aprendizagem automática, para mapear as interações efetuadas por um utilizador, em classes da taxonomia desenvolvida. Foram testadas duas estratégias para a implementação do TalKit. A primeira é baseada em aprendizagem automática e baseada em regras. A segunda estratégia é baseada, de novo, em aprendizagem automática, tendo sido criado o Mega Classificador, que utiliza como features as regras anteriormente desenvolvidas, bem como os restantes classificadores. Após a avaliação destas duas estratégias, concluiu-se que a primeira é melhor que a segunda, pois a primeira consegue classificar corretamente 87% interações e a segunda 80%. Finalmente, o classificador baseado em aprendizagem automática e baseada em regras foi usado para decidir que módulo escolher para obter uma resposta e usado numa avaliação feita com utilizadores. Concluiu-se que usar o Talkit obtém mais respostas plausíveis do que usar apenas o Talkpedia ou o Say Something Smart. Adicionalmente provou-se também que as extensões feitas ao Talkpedia, aumentam o número de respostas plausíveis devolvida pelo sistema., en=In this thesis we propose taxonomy for classifying interactions given by a user to a dialogue system and developed TalKit, with the purpose of responding to different types of interactions, choosing the modules responsible for the response based on that taxonomy. Two existing modules, the Say Something Smart and Talkpedia were used in this process, having the second been extended in this work. Multiple classifiers were implemented, which combine handwritten rules and modules created with machine learning techniques, to map the interactions made by a user, in taxonomy developed classes. Two strategies were tested for the implementation of TalKit. The first one based on machine learning and rule-based. The second strategy based, again, on machine learning, having been created the Mega Classificador, which uses features the rules previously developed, as well as the rest of the classifiers. After the evaluation of these two strategies, it was concluded that the first is better than the second, since the first manages to classify correctly 87% interactions and the second 80%. Finally, the classifier based on machine learning and rule-based was used to decide which module to choose to obtain a response and was used in an evaluation done with users. It was concluded that using the TalKit obtains more plausible answers than using just the Talkpedia or the Say Something Smart. Additionally it was proven that the extensions made to the Talkpedia, increase the number of plausible responses returned by the system.}
{pt=Compreensão de Língua Natural, Taxonomia para Diálogo, Classificação, Aprendizagem Automática, Baseado em Regras, en=Natural Language Understanding, Dialogue Taxonomy, Classification, Machine Learning, Rule-Based}

Maio 28, 2015, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar