Dissertação

Reinforcement Learning models of neuropeptide-modulated human brain function EVALUATED

A maneira como as alterações na química do cérebro afetam as nossas interações sociais não é ainda completamente compreendida e aprofundar os nossos conhecimentos nesta área pode permitir-nos criar novas terapêuticas para várias doenças. Vários algoritmos de Aprendizagem por Reforço foram utilizados para modelar processos de aprendizagem, tanto em animais como em humanos. Esta tese foca-se no estudo da relação entre a ativação dos Centros de Recompensa do cérebro humano e pârametros específicos de um algoritmo de Aprendizagem por Reforço, conhecido por Q-learning, utilizado como modelo para o processo de aprendizagem de um indivíduo enquanto este joga um jogo social iterativo semelhante ao famoso Dilema do Prisioneiro. Esta relação é testada e comparada entre grupos de participantes aos quais foram administrados, por meio de spray intranasal, doses de um Placebo, Oxitocina, ou Vasopressina. Os participantes são adultos de ambos os sexos com idades compreendidas entre os vinte e quarenta anos que foram agrupados por sexo durante as experiências.
Q-learning, Dilema do Prisioneiro, fMRI, Aprendizagem por Reforço

Outubro 30, 2018, 11:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Manuel Fernando Cabido Peres Lopes

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Diana Prata

Faculdade de Medicina da Universidade de Lisboa

Investigador Principal