Dissertação

Optimization of Message Ferrying UAV Paths using Monte Carlo Tree Search and Reinforcement Learning EVALUATED

Hoje em dia, a comunicação é um elemento indispensável para a grande maioria das atividades humanas, sejam estas económicas, sociais, ou outras. Apesar de haverem diversos métodos para o efeito tais como a Internet e os telemóveis, existem casos em que a conexão pode falhar, como em catástrofes naturais ou em aldeias remotas onde não existe infrastrutura de telecomunicações. Nestes casos, é necessário um método alternativo de transporte de mensagens, como por exemplo, o uso de veículos aéreos não tripulados (UAVs). Nesta tese, propõe-se a adaptação de dois grupos de algoritmos, um de planeamento (Procura em Árvore Monte Carlo (MCTS)) e outro de aprendizagem automática (Aprendizagem por Reforço (RL)), para a procura de caminhos eficientes em redes tolerantes a atrasos (DTNs). Esta comunicação vai ser considerada em duas topologias de rede: (1) de todos os nós para um nó comum e (2) de todos os nós para todos os nós. Os resultados mostram que tanto o método baseado em RL como o método baseado em MCTS obtêm melhores resultados quando comparados com soluções baseadas no Problema do Caixeiro Viajante (TSP), para ambas as topologias. O método baseado em RL teve resultados mais consistentes quando comparado com o MCTS, tendo também precisado de menos memória. Para redes maiores ainda serão necessárias otimizações de modo a obter melhorias significantes.
Rede Tolerante a Atrasos, Procura em Árvore Monte Carlo, Aprendizagem por Reforço, Veículo Aéreo não Tripulado

Julho 6, 2020, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

António Manuel Raminhos Cordeiro Grilo

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar