Dissertação

Traffic light control using Deep Reinforcement Learning EVALUATED

Este trabalho aborda o desenvolvimento de controladores semafóricos inteligentes (TSCs) usando técnicas de aprendizagem por reforço (RL), avaliando de que forma as diferentes dimensões do problema de decisão afetam a eficiência dos controladores resultantes. Em primeiro lugar, apresentamos uma nova metodologia para o desenvolvimento de TSCs. Esta metodologia contribui no sentido de uma aplicação mais ampla de RL no problema de controlo semafórico, por garantir um nível de standardização nas várias fases do processo experimental: configuração da simulação, design do TSC --- formulação do problema e seleção do método de RL --- bem como estimação da performance e comparação. Seguindo a metodologia proposta, fazemos um estudo de diferentes espaços de estados e funções de recompensa, assim como três algoritmos de RL (Q-learning, Deep Q-network, e Deep Deterministic Policy Gradient). Consideramos uma abordagem totalmente descentralizada do problema e um espaço de ação restrito. O desempenho dos controladores semafóricos desenvolvidos é avaliado usando diferentes cenários extraídos da cidade de Lisboa: uma interseção isolada, uma via arterial e um conjunto de ruas do centro da cidade.
Controlo semafórico, Aprendizagem por reforço, Sistemas inteligentes de transporte, Mobilidade urbana, Aprendizagem automática

janeiro 25, 2021, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Francisco António Chaves Saraiva de Melo

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

José Alberto Rodrigues Pereira Sardinha

Departamento de Engenharia Informática (DEI)

Professor Auxiliar