Dissertação

{pt_PT=Online learning of MPC for autonomous racing} {} EVALUATED

{pt=Nesta dissertação, é projetada uma arquitetura de Controlo por Modelo Preditivo (MPC) baseada em técnicas de aprendizagem automática com o propósito de controlar um veículo autónomo de Formula Student (FS). Para a implementação em tempo real deste controlador e também para satisfazer os requisitos das competições de FS, este é implementado em C++ e o problema de otimização do MPC é resolvido utilizando um software comercial. Resumidamente, o controlador é capaz de aprender iterativamente à medida que o veículo se auto conduz. Esta aprendizagem é realizada para dois propósitos distintos: melhoria da precisão do modelo do veículo utilizado pelo controlador e encontrar automaticamente os parâmetros do controlador que resultam em tempos de volta mais rápidos. Encontrar as equações matemáticas que descrevam na totalidade a dinâmica de um veículo FS requer o uso de modelos de veículo cuja obtenção é não trivial. Para este propósito, um modelo de Rede Neuronal Artificial (ANN) é adicionado ao modelo nominal com o intuito de modelar dinâmicas não consideradas no modelo original. A AAN é treinada com recurso a Aprendizagem Supervisionada (SL) de modo online, cuja aprendizagem se baseia em erros de previsão anteriores. Posteriormente, os parâmetros do controlador são afinados com recurso a métodos de Aprendizagem por Reforço (RL) com o objetivo de determinar os parâmetros que permitem melhores tempos de volta. Em simulação, serão realizados vários testes em três pistas diferentes. Nomeadamente, é demonstrado que, aplicando as duas técnicas mencionadas, o algoritmo permite uma redução até 16.5% dos tempos de volta., en=In this dissertation, a Learning based Model Predictive Control (LMPC) architecture is designed for the control of a Formula Student (FS) autonomous vehicle. For the implementation of this controller in real time to satisfy the FS driverless requirements, the C++ programming language is used and the MPC's optimization problem is solved using a commercial solver. In summary, the developed controller is able to iteratively learn as the vehicle drives itself. This learning process is carried out for two distinct purposes: improving the accuracy of the vehicle model used by the controller and automatically finding the controller parameters that result in the fastest lap times. Finding the mathematical equations that fully describe the race car dynamics requires the use of highly nonlinear vehicle nominal models which are difficult to obtain. For this purpose, an Artificial Neural Network (ANN) is added to a vehicle nominal model in order to correct for unmodeled dynamics not considered in the nominal model. The ANN is trained in an online Supervised Learning (SL) approach, which learns based on past model prediction errors. Furthermore, the controller's parameters are tuned in a Reinforcement Learning (RL) environment in order to find the set of parameters that iteratively allow for faster lap times. In a simulation environment, various tests on three different tracks are performed. Moreover, it is shown that by employing these two learning procedures, the full control algorithm is able to reduce lap times up to 16.5%.}
{pt=Controlo por Modelo Preditivo, Aprendizagem de Modelo, Trajetória e Seguimento de Caminho, Corridas Autónomas., en=Model Predictive Control, Model Learning, Motion and Path Planning, Autonomous Racing.}

dezembro 13, 2021, 10:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Miguel Afonso Dias de Ayala Botto

Departamento de Engenharia Mecânica (DEM)

Professor Catedrático

ORIENTADOR

Pedro Manuel Urbano de Almeida Lima

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Catedrático