Dissertação

Intelligent Agents Coordination in Ad Hoc Teams EVALUATED

O principal alvo deste documento é o campo científico do trabalho de equipa Ad Hoc (Ad Hoc Teamwork), no qual um agente inteligente ocupa uma posição numa equipa de agentes previamente construída. Este agente deve ser capaz de se coordenar com a equipa, sem ter tido conhecimento prévio das suas estratégias ou protocolos de comunicação, com o objetivo de atingir uma meta comum, no nosso caso em particular, ganhar um jogo da Liga de Simulação 2D da RoboCup. A dificuldade de desenvolver uma solução que tenha boa performance em domínios complexos constitui um grande desafio. Assumimos uma abordagem que consiste em identificar a tarefa, os colegas de equipa e, posteriormente, elaborar planos para atingir o nosso objetivo. Aplicando técnicas de aprendizagem automática, integramos o nosso agente num domínio dinâmico, multi-agente (Liga de Simulação 2D RoboCup), cuja complexidade é muito superior à dos domínios tradicionais usados nos problemas de trabalho de equipa Ad Hoc. Para atingir este objetivo, modelámos um Processo de Decisão de Markov (MDP) em que a função de recompensa é inicialmente desconhecida e, mais tarde, será obtida usando Aprendizagem por Reforço Inversa (IRL). Os restantes agentes e a formação da equipa são classificadas usando técnicas de aprendizagem supervisionada. Finalmente, o planeamento consiste em resolver o MDP usando um algoritmo de Iteração de Políticas. Com os resultados que obtivemos utilizando esta abordagem, provamos que é possível usar o trabalho de equipa Ad Hoc em domínios multi-agente complexos.
Agentes inteligentes, Sistemas multi-agente, Aprendizagem automática, Coordenação Ad Hoc, Processos de Decisão de Markov, Aprendizagem por Reforço Inversa

Novembro 8, 2016, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Francisco António Chaves Saraiva de Melo

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

José Alberto Rodrigues Pereira Sardinha

Departamento de Engenharia Informática (DEI)

Professor Auxiliar