Dissertação

An Adaptive and Transferable Dialog Management System for Social Aware Task Execution EVALUATED

Para um diálogo com um agente IA ser agradável, durante a interação, o agente necessita de interagir com os utilizadores tendo em conta não só a eficiência da tarefa como também preferências sociais. Esta tese introduz um modelo para controlo de diálogo com uma política social transferível. O modelo é composto por 2 componentes: um componente instrumental baseado em Partially Observable Markov Decision Problem (POMDP) cuja tarefa é atingir o objetivo instrumental da conversa sem consideração para normas sociais e um componente social que a cada iteração decide se deve manter a ação sugerida pela componente instrumental ou substituí-la por uma ação diferente. É dada uma prova matemática que a atualização da belief segue a propriedade de Markov e isto é usado para provar que técnicas de policy gradient e Reinforcement Learning podem ser usados para encontrar a politica social ótima. Uma simples implementação do modelo foi criada onde o utilizador tem ligeiras capacidades sociais. O utilizador foi simulado em 2 cenários com 2 personalidades diferentes. Mostrou-se que a aprendizagem da política social converge nos 4 pares de cenário/personalidade. Também se mostrou que, neste exemplo, a política social pode ser transferida entre cenários diferentes e manter uma boa performance.
Agente social, Controlo de Diálogo, Aprendizagem Adaptativa, Transferência de Tarefa, Sistemas de Fala

Novembro 11, 2020, 14:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Pedro Alexandre Simões dos Santos

Departamento de Matemática (DM)

Professor Auxiliar