Dissertação

{pt_PT=Marine Acoustic Signature Recognition using Convolutional Neural Networks} {} EVALUATED

{pt=No mar existe uma grande diversidade de fontes sonoras: animais marinhos, fenómenos atmosféricos e atividades humanas. Em resposta às preocupações ecológicas e à necessidade de um maior controlo na navegação, o reconhecimento dessas fontes constitui um desafio. O objetivo deste trabalho consiste em construir um modelo que analise sinais acústicos captados por hidrofones e que os classifique de acordo com a fonte sonora. Assim, propõe-se a aplicação de uma rede neuronal convolucional (CNN) que recebe a representação do sinal em mel-espectrograma, dividido em pequenos intervalos (janelas), e o resultado do cálculo da primeira e segunda derivada do mesmo mel-espectrograma. Para cada janela, são atribuídos class scores pela CNN. Esta metodologia é aplicada a duas bases de dados formadas por sinais hidroacústicos. A primeira constituída por ruído de embarcações, a partir da qual se pretende detetar a sua presença, diferenciando-as em função da dimensão. Usando o mel-espectrograma e o mel-espectrograma em conjunto com a primeira e segunda derivada, obtém-se, respetivamente, uma exatidão de 83.2% e 88.8%. A segunda base de dados complementa a primeira com vocalizações de golfinhos e de baleias. Três técnicas de aumento de dados (time stretching, pitch shifting e time shifting) são estudadas. Aplicadas individualmente, ou simultaneamente, permitem um melhor desempenho em relação ao modelo sem aumento de dados. A influência da dimensão de janelas é também estudada, através da construção de cinco modelos em que a dimensão da janela varia entre 0.22 s e 1.97 s. A percentagem de exatidão situa-se entre os 66.2% e os 78.3%., en=In a marine environment, there is a great diversity of sound sources: marine animals, natural phenomena and man-made activity. Differentiating these sources is an important response to ecological challenges and to ensure better control of the coastline. The current work aims to devise a model which analyses acoustic signals from hydrophones and classifies them according to the sound source. To achieve this, a convolution neural network (CNN) is proposed as a classifier, using the mel spectrogram representation divided into small intervals (windows) of the acoustic signal and its derivatives as input. Class scores are assigned to each window by the CNN. The developed methodology is applied to two different datasets composed of hydroacoustic data. The first comprises vessel noise data, where the objective is to detect the presence of vessels and distinguish the vessels according to the size. A classification accuracy of 83.2% and 88.8% is achieved using the mel spectrogram and the mel spectrogram plus its first and second derivatives as features, respectively. The second dataset complements the previous one by adding dolphin and whale vocalizations. Three data augmentation techniques (time stretching, pitch shifting and time shifting) are studied. Whichever of the three techniques is used individually outperform the model without data augmentation. This is equal true when all three techniques are used simultaneously. The impact of the window length is also studied, with five different models being creating where the window length varies between 0.22 s and 1.97 s. The classification accuracy ranges between 66.2% and 78.3%.}
{pt=Reconhecimento de sinais hidroacústicos, rede neuronal convolucional, mel-espectrograma, base de dados ShipsEar, ruído de embarcações, vocalização de animais marinhos, en=Hydroacoustic signal recognition, convolutional neural network, mel spectrogram, ShipsEar dataset, vessel noise, marine animal vocalizations}

julho 19, 2021, 13:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Guilherme Vaz

WavEC - Offshore Renewables

Coordenador da Área de Supercomputação e Ciência de dados

ORIENTADOR

João Miguel Da Costa Sousa

Departamento de Engenharia Mecânica (DEM)

Professor Catedrático