Dissertação
Aprendizagem de reforço em sistemas multiagente para controlo optimizado de acesso múltiplo em redes sem fios cognitivos e descentralizados EVALUATED
O uso de redes sem fios tem vindo a aumentar nos últimos anos, levando à falta de recursos ou bandas no uso quotidiano dos utilizadores. Consequentemente, surgiram vários desafios para a obtenção de uma boa qualidade no seu uso. Nesta dissertação, propõe-se a utilização das ferramentas de Aprendizagem por Reforço para endereçar o problema de acesso múltiplo na rede sem fio, analisando a ocupação espectral partilhada ou “Joint Spectrum Sensing”, e a seleção de canais disponíveis ou “Channel Selection” dentro de uma rede sem fios. Vai ser utilizada a tecnologia de rádio cognitivo, onde são definidos vários utilizadores secundários ou rádios cognitivos para detetar a disponibilidade das frequências licenciadas, para que seja aproveitado o espectro licenciado que não foi utilizado. Dois tipos de métodos de aprendizagem por reforço vão ser propostos, que são a avaliação da política e a otimização da política. Os métodos vão ser simulados pelo MATLAB. Na avaliação da política, vai ser utilizado o algoritmo da diferença temporal para calcular as funções de valores e o erro quadrático das funções de valores, e, na otimização de política, vai ser utilizado o algoritmo de Q-learning para determinar as funções de valores de ação e as taxas de transferências e de colisões de uma rede. Para obter a convergência nos resultados da simulação, é introduzido o esquema de consenso, pois a rede que vai ser analisada é uma rede descentralizada.
junho 20, 2024, 9:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado