Dissertação

{pt_PT=Learning control policies in smart cities from physical data} {} EVALUATED

{pt=As emissões dos veículos a motor são a principal contribuição para o aumento dos níveis da poluição ambiente. A rápida urbanização e a falta de uma boa solução para gerir o trânsito está a forçar as cidades a tirar medidas drásticas contra a indústria automóvel. Nesta dissertação, é feito um estudo de caso do trânsito em Trondheim e é criada uma simulação realista, a partir de dados do mundo real, que simula o trânsito e as emissões. Seguidamente, é proposta uma solução baseada em Aprendizagem por Reforço que controla o acesso a diferentes regiões da cidade por forma a optimizar o trânsito, dada uma métrica desejada. Também são vistos diferentes aperfeiçoamentos, como a utilização de um sistema multi-agente e utilização de dados pré-gerados para a fase de treino. Os resultados obtidos são comparados com o cenário base e contra um agente reactivo. No final, avaliam-se os pontos fortes e fracos da solução, e propõem-se possíveis futuras melhorias., en=Motor vehicle emissions are the primary contributors to the increase in ambient pollution levels. Rapid urbanization and lack of a good solution to manage the traffic are forcing cities to take drastic measures against the automotive industry. In this thesis, we build a case study of the Norwegian city of Trondheim's traffic, and create a realist simulation based on real world data, that simulates the traffic and the emissions. We then propose a Reinforcement Learning based solution that controls the access to the different regions of the city to optimize the traffic given a desired metric. We also take a look at different improvements, like using a multi-agent system and using pre-generated data for the training phase. We compare the obtained results with the baseline and against a reactive agent. At the end we assess the solution's strengths and weaknesses, and propose possible future improvements. }
{pt=Aprendizagem Profunda, Aprendizagem por Reforço, Sistema Multi-agente, en=Deep Learning, Reinforcement Learning, Multi-Agent System}

Novembro 11, 2020, 9:0

Orientação

ORIENTADOR

Tiago Santos Veiga

Institutt for datateknologi og informatikk - NTNU

Investigador

ORIENTADOR

Pedro Manuel Urbano de Almeida Lima

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Catedrático