Dissertação

{pt_PT=Tácticas de futebol robótico com controlo preditivo} {} EVALUATED

{pt=O objetivo desta dissertação consiste em controlar um grupo de robôs que cooperam entre si para alcançar um objetivo comum, que consiste em confrontar e vencer outros robôs num enquadramento de futebol robótico. Inicialmente, o comportamento de um único robô num ambiente isolado é imposto projetando um controlador com base em métodos do controlo preditivo, que optimiza uma função de custo que reflete os objetivos da missão. Posteriormente, são considerados ambientes com uma complexidade crescente, ou seja, a partir de um cenário simples em que um robô vai de um ponto de partida para outro e aumentando a complexidade adicionando obstáculos (estáticos e dinâmicos) entre dois pontos. O próximo passo é adicionar mais robôs ao sistema e aumentar a complexidade dos cenários como antes. O cenário mais simples é aquele em que dois robôs vão de um ponto a outro, e o mais complexo é, por exemplo, um robô que se desloca pela lateral e lança a bola cuja posição o outro tem de prever e atingir. Por fim, são consideradas situações com oponentes estáticos e dinâmicos, onde se usam técnicas de jogos diferenciais para desenvolver estratégias para equipas oponentes. O sistema global de controlo está estruturado em dois níveis hierárquicos. O nível mais baixo concentra-se em controlar o movimento dos jogadores e das suas interações. O nível mais alto é onde se define a estratégia a ser implementada pela equipa, sendo sugerido a utilização de aprendizagem por reforço para a optimizar. , en=The objective of this dissertation consists in controlling a group of robots that cooperate with each other in order to achieve a common goal, that consists of confronting and winning other robots in a football scenario. Firstly, the behaviour of a single robot on a isolate environment is imposed by designing a controller based on model predictive control, that optimizes a cost function that reflects the goal. Subsequently, environments with a growing complexity are considered, i.e, starting from a simple scenario where a robot goes from one starting point to another, and increasing the complexity by adding obstacles (static and dynamic) between two points. The next step is to add more robots to the system and increase the complexity of the scenarios just as before. The simplest scenario is the one in which two robots go from one point to another, and more complex one is, e.g., a robot moving on the sideline shoots the ball, the objective being that the other robot predicts and moves to where the ball will go. Finally, we will consider situations with static and dynamic opponents, where we will use differential game techniques to develop strategies for opposing teams. The control system is structured in two hierarchical levels. The lower level focuses on controlling the movement of the players and their interactions. The higher level is the one in which we define the strategy to be implemented by the team, proposing the use of reinforcement learning to optimize the strategy. }
{pt=Controlo Preditivo baseado em Modelos, Controlo Cooperativo, Jogos Diferenciais, Aprendizagem por Reforço, Futebol Robótico., en=Model Predictive Control, Cooperative Control, Differential Game, Reinforcement Learning, Robotic Football.}

Julho 22, 2020, 10:0

Orientação

ORIENTADOR

João Manuel Lage de Miranda Lemos

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Catedrático