FenixEdu™

Dissertação

{en_GB=Speech Recognition for a Small Aerial Robot} {} EVALUATED

Detalhes: {pt=Veículos aéreos não-tripulados são aeronaves que permitem a recolha de dados em áreas de difícil acesso. Capturar áudio com um drone despoleta uma série de novas aplicações. O ruído proveniente dos motores é dos principais problemas identificados em reconhecimento de fala com drones. O nosso principal objectivo é apresentar soluções para superar os maus desempenhos de sistemas de reconhecimento de fala devido a este tipo específico de ruído. O teste do Filtro de Wiener, Filtro Adaptativo de Mínimos Quadrados, Noise Gate, Subtracção Espectral dependente de Movimento e Transformada Discreta de Wavelet foi realizada para diferentes valores de relação Sinal-Ruído. Devido aos resultados, o Filtro Adaptativo de Mínimos Quadrados é escolhido para integrar o Sistema de Reconhecimento de Fala. Uma Rede Neuronal que prevê os coeficientes do filtro a partir das velocidades dos 4 motores é desenvolvida para o sistema, resultando num melhor desempenho do mesmo. A última proposta de alteração no filtro é utilizar como entrada dois sinais com diferentes valores de relação Sinal-Ruído em vez de utilizar um sinal apenas de ruído e outro de fala com ruído. Uma Rede Neuronal Recorrente para Reconhecimento de Fala treinada com fala corrompida pelo ruído do drone também foi testada, mas esta abordagem não mostrou ser competitiva com a implementação anterior. Resultados experimentais mostram que utilizar o Filtro Adaptativo de Mínimos Quadrados com os coeficientes do filtro a serem calculados por uma Rede Neuronal e utilizar dois sinais ruidosos com diferentes valores de relação Sinal-Ruído é uma solução promissora para este problema. , en=Unmanned Aerial Vehicles are aircrafts that allow the gathering of data in remote areas of difficult access. Capturing audio signals with a drone triggers a series of new applications. The reason why Speech Recognition hasn’t been widely developed for drones is the corrupting noise the engines add to the speech signals. The main goal of this research is to present a study on how to overcome the bad speech recognition performances due to this specific type of noise. The implementation and testing of Wiener Filter, Least-Mean-Square Adaptive Filter, Noise Gate, Motion-Dependent Spectral Subtraction and Discrete Wavelet Transform was done for different levels of Signal-to-Noise Ratio. Due to the very promising results, the Least-Mean-Square Adaptive Filter is chosen for further improving a Speech Recognition System. A Feedforward Neural Network that predicts the filter’s coefficients from the information on the velocities of the 4 motors is developed and integrated in the system resulting in a better performance. The last proposal of change in the filter is using as input two signals with different Signal-to-Noise Ratio values instead of the noisy speech and the noise-only speech signals. A Recurrent Neural Network for Speech Recognition trained with speech corrupted by the drone’s ego-noise was also tested but this approach didn’t show to be competitive with the previous implementation. Experimental results show that using the Least-Mean-Square Adaptive Filter with filter’s coefficients computed by a Neural Network and using two noisy signals with different Signal- to-Noise Ratio values is a good solution for the problem explored.}
Keywords: {pt=Reconhecimento de Fala, Veículos Aéreos Não Tripulados, Sinais de Fala com Ruído, Filtro Adaptativo de Mínimos Quadrados, Cancelamento de Ruído Próprio, en=Speech Recognition, Unmanned Aerial Vehicles, Noisy Speech Signal, Least-Mean-Square Adaptive Filter, Ego-noise Cancellation}

Discussão: junho 27, 2019, 10:0