Dissertação

{en_GB=Reinforcement Learning for Two-Player Zero-Sum Games} {} EVALUATED

{pt=Com a rapida evolução do poder computacional das últimas décadas, especialmente na área de computação gráfica, a aprendizagem por reforço tem-se tornado cada vez mais popular, com a geração de algoritmos novos e a renovação e reformulação de outros. Nesta tese começamos por introduzir alguns conceitos não só classicos como também mais recentes na área de Machine Learning. De seguida apresentamos os projectos mais relevantes dos últimos anos no domínio de aprendizagem com recurso a redes neuronais profundas aplicada a jogos. Com esta análise pretendemos clarificar o que foi feito em outras publicações, como foi feito e porquê. O objectivo deste trabalho é criar agentes que consigam aprender a avaliar situaçoes em jogos de soma-zero e agir consoante as suas percepções, idealmente tomando as melhores decisões possíveis. Ademais, pretendemos compreender quais são as limitações do hardware disponível actualmente para o público em geral. Foram desenvolvidos três agentes baseados em diferentes técnicas de aprendizagem por reforço. Neste trabalho está descrito o processo de desenvolvimento dos mesmos, assim como os detalhes que é preciso ter em consideração quando se encara um desafio como este. Os agentes, neste caso em particular, foram treinados para actuar no jogo das Damas e no jogo Quatro em Linha., en=With the continuous evolution of computational power, especially in the computer graphics area, Reinforcement Learning has been gaining traction in the community as many novel methods are being created and older ones revamped. In this thesis, we start by introducing classic and recent developments in the field of machine learning, followed by an overview of the most relevant work done with deep neural networks applied to games. We hope this analysis gives insight and helps to clarify what was done in the previous publications and why. This work's objective is to craft agents able to learn to evaluate a position of a zero-sum game and act upon it, choosing a good, if not the best, action that yields the biggest rewards. Moreover, we seek to understand how far current hardware available to the public can take us. We developed three agents based on different Reinforcement Learning techniques. We describe how we developed such agents and what sort of details one must take into consideration when faced with such a challenge. In this particular thesis, we focused on the games of Connect Four and Checkers.}
{pt=Inteligência Artificial, Aprendizagem por Reforço, Redes Neuronais, Jogos de Soma-Zero, en=Artificial Intelligence, Reinforcement Learning, Neural Networks, Zero-Sum Games}

Novembro 27, 2019, 16:30

Orientação

ORIENTADOR

Andreas Miroslaus Wichert

Departamento de Engenharia Informática (DEI)

Professor Auxiliar