Dissertação

Character Locomotion using Imitation Learning from Observations with Wavelets EVALUATED

Esta dissertação apresenta uma extensão ao paradigma de Aprendizagem por Imitação de Observações através da integração de informação de frequências na estrutura de aprendizagem, no contexto de animação de corrida 3D com base em simulação física. Este tipo de animação é muito repetitiva pelo que deverá ser possível melhorar o sistema ao introduzir informação de frequências. Nesta tese, nós propusemos um Modelo para Aprendizagem por Imitação de Observações Aumentada com Wavelet, através da implementação do componente de extracção de Transformada de Wavelet tendo o DeepMimic como base, e realizando testes empíricos para desenvolver e testar a nossa abordagem em relação ao DeepMimic. Os resultados mostram que o modelo implementado não apresenta qualquer benefício para a política treinada. Além disso, houve um aumento drástico no tempo de treino e a política obtida teve um desempenho semelhante com menor resiliência a forças externas, comparando com o sistema base. O código é disponibilizado em https://github.com/jocarias/DeepMimic
Aprendizagem por Imitação de Observações, Transformada de Wavelet Contínua, Rede Neural Convolucional, Aprendizagem por Reforço, DeepMimic.

janeiro 13, 2021, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Pedro Alexandre Simões dos Santos

Departamento de Matemática (DM)

Professor Auxiliar

ORIENTADOR

João Miguel de Sousa de Assis Dias

Faculdade de Ciências e Tecnologia, Universidade do Algarve

Professor Auxiliar