Dissertação

Ad Hoc Teamwork under Partial Observability EVALUATED

Neste trabalho, apresentamos um novo algoritmo, ATPO, baseado em inferência Bayesiana para resolver o problema de Ad Hoc teamwork em um ambiente de observabilidade parcial, permitindo a cooperação com agentes desconhecidos que desejam concluir uma tarefa desconhecida sem precisar de protocolos de coordenação. ATPO acomoda a observabilidade parcial usando as observaçẽs do agente para identificar com qual agente está a cooperar com e qual tarefa quer concluir. Esta abordagem não pressupõe que as ações do colega de equipa sejam visíveis. Exploramos diferentes cenários como: identificar e adaptar-se ao seu colega de equipa de acordo com o seu comportamento; identificar qual das tarefas conhecidas o seu colega de equipa está a tentar concluir; identificar ambos. Os resultados mostram que ATPO pode identificar de forma eficiente e robusta qual das capturas o seu colega de equipa quer concluir, também obtendo resultados razoáveis ao identificar o seu colega de equipa. Além disso, a sua eficiência em concluir um certo objectivo varia de acordo com a quantidade de informação que lhe é fornecida. O seu desempenho pode variar entre quase perfeito, quando ele sabe qual dos objetivos têm de atingir mas não conhece o seu colega de equipa, e ter um desempenho 57% mais lento do que o comportamento ideal, quando ele não conhece nem o seu colega de equipa nem o objectivo a atingir. Finalmente, o nosso agente mostra uma boa escalabilidade, sendo capaz de se adaptar a ambientes maiores e ambientes mais incertos.
Ad Hoc Teamwork, Partial Observability, Pursuit domain, Bayesian inference, Multi-Agent Systems

novembro 16, 2021, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

José Alberto Rodrigues Pereira Sardinha

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Francisco António Chaves Saraiva de Melo

Departamento de Engenharia Informática (DEI)

Professor Associado