Dissertação
An Adaptive and Transferable Dialog Management System for Social Aware Task Execution EVALUATED
Para um diálogo com um agente IA ser agradável, durante a interação, o agente necessita de interagir com os utilizadores tendo em conta não só a eficiência da tarefa como também preferências sociais. Esta tese introduz um modelo para controlo de diálogo com uma política social transferível. O modelo é composto por 2 componentes: um componente instrumental baseado em Partially Observable Markov Decision Problem (POMDP) cuja tarefa é atingir o objetivo instrumental da conversa sem consideração para normas sociais e um componente social que a cada iteração decide se deve manter a ação sugerida pela componente instrumental ou substituí-la por uma ação diferente. É dada uma prova matemática que a atualização da belief segue a propriedade de Markov e isto é usado para provar que técnicas de policy gradient e Reinforcement Learning podem ser usados para encontrar a politica social ótima. Uma simples implementação do modelo foi criada onde o utilizador tem ligeiras capacidades sociais. O utilizador foi simulado em 2 cenários com 2 personalidades diferentes. Mostrou-se que a aprendizagem da política social converge nos 4 pares de cenário/personalidade. Também se mostrou que, neste exemplo, a política social pode ser transferida entre cenários diferentes e manter uma boa performance.
Novembro 11, 2020, 14:0
Documentos da dissertação ainda não disponíveis publicamente