Dissertação

Using Deep Learning to create an Universal Game Player EVALUATED

Nesta dissertação introduzimos uma nova arquitectura de agentes inteligentes que permite (i) transferir conhecimento de tarefas previamente aprendidas para uma nova tarefa à qual tem como objectivo aprender e (ii) lembrar-se de como exercer as tarefas previamente aprendidas enquanto aprende a nova. A arquitectura proposta modifica a recente arquitectura actor-crítico assíncrona, em GPU (GA3C), permitindo-a ser aplicada a aprendizagem multi-tarefa, e adiciona-lhe o algoritmo "Elastic Weight Consolidation" (EWC) de modo a aliviar o esquecimento catastrófico. Com o agente obtido, ao qual chamamos de "Universal Game Player" (UGP), mostramos que (i) aprender várias tarefas em simultâneo facilita a aprendizagem de uma nova tarefa, semelhante às anteriores e (ii) adicionando o algoritmo EWC ao GA3C, é possível evitar uma quantidade substancial de esquecimento catastrófico.
Agentes Inteligentes, Redes Neuronais, Aprendizagem por Reforço Profunda, Aprendizagem Multi-Tarefa, Aprendizagem por Transferência, Esquecimento Catastrófico

Outubro 31, 2018, 16:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

João Miguel De Sousa de Assis Dias

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Francisco António Chaves Saraiva de Melo

Departamento de Engenharia Informática (DEI)

Professor Associado