Dissertação

Aprendizagem de reforço em sistemas multiagente para controlo optimizado de acesso múltiplo em redes sem fios cognitivos e descentralizados EVALUATED

O uso de redes sem fios tem vindo a aumentar nos últimos anos, levando à falta de recursos ou bandas no uso quotidiano dos utilizadores. Consequentemente, surgiram vários desafios para a obtenção de uma boa qualidade no seu uso. Nesta dissertação, propõe-se a utilização das ferramentas de Aprendizagem por Reforço para endereçar o problema de acesso múltiplo na rede sem fio, analisando a ocupação espectral partilhada ou “Joint Spectrum Sensing”, e a seleção de canais disponíveis ou “Channel Selection” dentro de uma rede sem fios. Vai ser utilizada a tecnologia de rádio cognitivo, onde são definidos vários utilizadores secundários ou rádios cognitivos para detetar a disponibilidade das frequências licenciadas, para que seja aproveitado o espectro licenciado que não foi utilizado. Dois tipos de métodos de aprendizagem por reforço vão ser propostos, que são a avaliação da política e a otimização da política. Os métodos vão ser simulados pelo MATLAB. Na avaliação da política, vai ser utilizado o algoritmo da diferença temporal para calcular as funções de valores e o erro quadrático das funções de valores, e, na otimização de política, vai ser utilizado o algoritmo de Q-learning para determinar as funções de valores de ação e as taxas de transferências e de colisões de uma rede. Para obter a convergência nos resultados da simulação, é introduzido o esquema de consenso, pois a rede que vai ser analisada é uma rede descentralizada.
Aprendizagem por Reforço, rede de rádio cognitiva, controlo de acesso múltiplo, otimização, rede sem fio

junho 20, 2024, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Milos S. Stankovic

Universidade Singidunum, Belgrado

Professor Associado

ORIENTADOR

Marko Beko

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado