Dissertação

{en_GB=Reinforcement Learning models of neuropeptide-modulated human brain function} {} EVALUATED

{pt=A maneira como as alterações na química do cérebro afetam as nossas interações sociais não é ainda completamente compreendida e aprofundar os nossos conhecimentos nesta área pode permitir-nos criar novas terapêuticas para várias doenças. Vários algoritmos de Aprendizagem por Reforço foram utilizados para modelar processos de aprendizagem, tanto em animais como em humanos. Esta tese foca-se no estudo da relação entre a ativação dos Centros de Recompensa do cérebro humano e pârametros específicos de um algoritmo de Aprendizagem por Reforço, conhecido por Q-learning, utilizado como modelo para o processo de aprendizagem de um indivíduo enquanto este joga um jogo social iterativo semelhante ao famoso Dilema do Prisioneiro. Esta relação é testada e comparada entre grupos de participantes aos quais foram administrados, por meio de spray intranasal, doses de um Placebo, Oxitocina, ou Vasopressina. Os participantes são adultos de ambos os sexos com idades compreendidas entre os vinte e quarenta anos que foram agrupados por sexo durante as experiências., en=The way alterations in the chemistry of the human brain affect social interactions is still not fully understood and deepening our knowledge in this field could allow us to create novel medical therapeutics for a variety of diseases. Various Reinforcement Learning algorithms have been used to model learning processes in both animals and humans. This thesis focuses on the study of the relation between the activation of the Reward Centers of the human brain and specific parameters of a Reinforcement Learning algorithm. This algorithm is known as Q-learning and is used as a model for the learning process of an individual playing an iterated Prisoner’s Dilemma styled social game for monetary rewards. This relation is tested and compared between subject groups that are administered, by means of intranasal spray, either placebos, Oxytocin or Vasopressin. Subjects are adults of both genders with ages in the 20 to 40 years range and are grouped by gender during experiments.}
{pt=Q-learning, Dilema do Prisioneiro, fMRI, Aprendizagem por Reforço, en=Q-learning, Prisoner’s Dilemma, fMRI, Reinforcement Learning}

Outubro 30, 2018, 11:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Manuel Fernando Cabido Peres Lopes

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Diana Prata

Faculdade de Medicina da Universidade de Lisboa

Investigador Principal