Dissertação

Ad hoc teamwork with unknown task model and teammate behavior EVALUATED

Esta tese aborda o problema de ad hoc teamwork. Ad hoc teamwork consiste em criar um agente que coopera com uma equipa sem pre-coordenacao. Nos focamo-nos nos cenários em que o modelo da tarefa e do mundo são desconhecidos, e o agente tem que aprender a tarefa, aprender o comportamento dos colegas de equipa e adaptar-se a eles. Nos propomos uma nova solução que combina model-based reinforcement learning com Monte Carlo tree search para que o agente ad hoc aprenda a tarefa e consiga coordenar com o resto da equipa. Nos modelamos o ambiente e o comportamento da equipa usando deep neural networks que são aprendidas a medida que o agente explora. Usando esta abordagem model-based, conseguimos atingir uma boa performance sem usar muitos samples. A solução e demonstrada no conhecido pursuit domain e os nossos resultados mostram que e competitiva com soluções state-of-the-art que assumem perfeito conhecimento da tarefa e do comportamento da equipa.
Ad hoc teamwork, Aprendizagem multi-agente, Aprendizem com base em modelo, Intelegencia artificial, Deep learning

Outubro 31, 2018, 9:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

José Alberto Rodrigues Pereira Sardinha

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Francisco António Chaves Saraiva de Melo

Departamento de Engenharia Informática (DEI)

Professor Associado