Dissertação

{en_GB=Character Locomotion using Imitation Learning from Observations with Wavelets} {} EVALUATED

{pt=Esta dissertação apresenta uma extensão ao paradigma de Aprendizagem por Imitação de Observações através da integração de informação de frequências na estrutura de aprendizagem, no contexto de animação de corrida 3D com base em simulação física. Este tipo de animação é muito repetitiva pelo que deverá ser possível melhorar o sistema ao introduzir informação de frequências. Nesta tese, nós propusemos um Modelo para Aprendizagem por Imitação de Observações Aumentada com Wavelet, através da implementação do componente de extracção de Transformada de Wavelet tendo o DeepMimic como base, e realizando testes empíricos para desenvolver e testar a nossa abordagem em relação ao DeepMimic. Os resultados mostram que o modelo implementado não apresenta qualquer benefício para a política treinada. Além disso, houve um aumento drástico no tempo de treino e a política obtida teve um desempenho semelhante com menor resiliência a forças externas, comparando com o sistema base. O código é disponibilizado em https://github.com/jocarias/DeepMimic, en=This dissertation presents a novel extension to the paradigm of Imitation Learning from Observations by integrating frequency information into the learning structure, in the context of 3D physically-based running animation. This kind of animation is very repetitive, thus it may be possible to improve the system by introducing frequency information. In this thesis, we proposed a Model for Wavelet Augmented Imitation Learning from Observations, by implementing a Wavelet Transform extraction component on top of DeepMimic, and conducted empirical tests to further develop and test our approach against the DeepMimic framework. Results show that the implemented model offered no benefit to the trained policy. Moreover, there was a dramatic increase in training time and the obtained policy had similar performance but was less resilient to external forces, compared to the base system. The code is available at https://github.com/jocarias/DeepMimic}
{pt=Aprendizagem por Imitação de Observações, Transformada de Wavelet Contínua, Rede Neural Convolucional, Aprendizagem por Reforço, DeepMimic., en=Imitation Learning from Observations, Continuous Wavelet Transform, Convolutional Neural Network, Reinforcement Learning, DeepMimic.}

janeiro 13, 2021, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Pedro Alexandre Simões dos Santos

Departamento de Matemática (DM)

Professor Auxiliar

ORIENTADOR

João Miguel de Sousa de Assis Dias

Faculdade de Ciências e Tecnologia, Universidade do Algarve

Professor Auxiliar