Dissertação

{pt_PT=Reinforcement Learning for Battery Operation: Energy Arbitrage Considering Battery Degradation } {} EVALUATED

{pt=Os sistemas de armazenamento de energia (BESS) proporcionam aos seus proprietários maior controlo sobre o uso de energia. Realizando arbitragem de energia (EA), os proprietários conseguem reduzir as suas despesas energéticas. Contudo, a maioria carece do conhecimento necessário para optimizar estes sistemas para EA. Neste tipo de ambientes de sistema de energia dinâmicos, a aprendizagem por reforço (RL) destaca-se como uma poderosa ferramenta de tomada de decisão, capaz de maximizar os lucros alcançáveis por EA. Todavia, o desempenho de uma bateria é inconstante, porque a sua capacidade diminui progressivamente. É fundamental tomar em conta esta degradação da bateria para obter resultados fiavéis, pois pode prejudicar potenciais lucros de EA, talvez mais ainda se for desconsiderada. Este trabalho utiliza RL para encontrar a forma ideal de operar uma bateria que fornece serviços de EA residencial, considerando a degradação da bateria prevista por um modelo de aprendizagem semi-supervisionada. Analisam-se três cenários: um onde o algoritmo é treinado numa bateria com capacidade máxima constante irrealista, um que considera a capacidade real ao longo da vida da bateria e calcula o verdadeiro resultado das decisões tomadas no primeiro cenário, e um onde o algoritmo é treinado numa bateria com capacidade real decrescente. Os resultados mostram que, se a degradação for desconsiderada durante a operação da bateria, os custos de degradação reduzem potenciais lucros em 13%. Se considerada, esta percentagem cai para 4%. Ter em conta a degradação pode também aumentar a vida da bateria em 20%, adiando a sua substituição e investimentos associados., en=Battery energy storage systems (BESS) provide their owners greater control over their energy usage. By performing energy arbitrage (EA), BESS owners' can effectively lower their energy bills. Nevertheless, most lack the necessary knowledge to optimally operate these systems for EA. In this type of dynamic power system environments, reinforcement learning (RL) emerges as a powerful tool for decision-making, capable of maximizing the attainable profits from EA. Yet, a battery's performance throughout its lifetime is not consistent since, as the battery ages and degrades, its capacity decreases. Considering battery degradation is fundamental to obtain results that are reliable, since this aspect can hinder the potential economic benefits of EA, possibly even more so if not taken into account. This work uses RL to find the optimal policy for operating a battery providing residential EA services, including battery degradation predicted by a semi-supervised learning model. Three scenarios are analysed: one where the algorithm is trained on a battery with an unrealistic constant maximum capacity, one which considers the real capacity throughout the battery's lifetime and calculates the true output of the actions that were taken in the first scenario, and one where the algorithm is trained on a battery with a real decreasing capacity. Results show that if degradation is disregarded when operating a battery, degradation costs can reduce possible profits by 13%. If degradation is considered, this percentage drops to 4%. Acting with awareness of degradation can also increase the battery's lifetime by 20%, postponing its replacement and associated investments.}
{pt=Aprendizagem por Reforço, Sistema de Armazenamento de Energia, Arbitragem de Energia, Degradação de Bateria, Redes Neuronais, Estado de Saúde, en=Reinforcement Learning, Energy Storage System, Energy Arbitrage, Battery Degradation, Neural Networks, State of Health}

novembro 27, 2023, 16:0

Orientação

ORIENTADOR

Jochen Lorenz Cremer

TU Delft

Professor Auxiliar

ORIENTADOR

Ilídio Pereira Lopes

Departamento de Física (DF)

Professor Catedrático