Dissertação

{en_GB=Modelling collective dynamics in climate chance agreements} {} EVALUATED

{pt=Podemos ver a cooperação como sendo o objetivo principal de qualquer acordo de mudanças climáticas. No entanto, nem sempre é fácil alcançar este objetivo devido à tentação de não contribuir enquanto se tenta recolher os benefícios do trabalho dos outros. Usando um sistema multiagente, onde os agentes jogam um “jogo de bens públicos” e aprendem a jogar através de aprendizagem por reforço, simulamos como países podem não cair na Tragédia dos Comuns. Estamos interessados em investigar em que condições a cooperação entre agentes emerge e como esta se torna estável. Exploramos várias configurações possíveis, configurações de aprendizagem e o papel de vários tipos de fatores externos. Neste documento mostramos que em grupos mais pequenos a cooperação é mais fácil e que as contribuições para o bem comum aumentam. Também analisamos o comportamento dos agentes quando estes são sujeitados a objetivos incertos e a erros. Verificamos que, ainda assim, a cooperação é sustentável, bastando que a variância de objetivos e a taxa de erros sejam baixas. Finalmente, demonstrámos que quando os agentes são criados com diferentes níveis de riqueza, as decisões de cooperar ou não passam a incidir principalmente no grupo de ricos. Admiravelmente, mesmo não comunicando entre si e recorrendo a um simples algoritmo de aprendizagem por reforço, os agentes, conseguem convergir na adoção do mesmo conjunto de ações, originando perfis de estratégias que se constituem justos e equitativos., en=Cooperation can be seen as the ultimate goal in any climate change agreement. However, this is not always easy to achieve because there is a clear temptation to free-ride and acquire all the benefits of the deals, without any individual investment or effort. Using a multi-agent system where agents play a Public Goods Game and revise their strategies through reinforcement learning, we simulate how countries may cooperate and avoid falling into the Tragedy of the Commons. We are interested in investigating in which conditions cooperation between agents emerge and become stable in the long run. We will explore several types of group configurations, learning configurations and the role of several kinds of externalities. In this report, we show that cooperation emerges easily within smaller groups. We were also able to conclude that agents can cooperate when subject to an uncertain objective or to errors, provided that variance/errors are low. Finally, we demonstrate that, when agents are created with different levels of wealth, the decision of cooperating shifts to rich agents that have the power to achieve the goals almost by themselves. Remarkably, even though the agents do not have any communication system, they were able to converge to the same small set of actions, showing that agents can learn independently to play the same small set of strategies.}
{pt=Sistema multiagente, Aprendizagem por Reforço, Alterações Climáticas, Tragédia dos Comuns, Cooperação, Jogos de Bens Públicos, en=Multiagent System, Reinforcement Learning, Climate Change, Tragedy of the Commons, Cooperation, Public Good Games}

Novembro 10, 2017, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Francisco João Duarte Cordeiro Correia dos Santos

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Fernando Pedro Pascoal dos Santos

Departamento de Engenharia Informática (DEI)

Colaborador Docente