Dissertação

Real time audio system for SNR improvement with applications to distant speech recognition EVALUATED

Nesta tese estudou-se o método de separação de fontes DUET de forma a avaliar o seu potencial para vir a funcionar como interface de processamento de sinais de fala em tempo-real de forma a alimentar software de reconhecimento automático de fala e assim obter um sistema de reconhecimento de fala à distância em ambientes com pouco eco e mais que um locutor. A dispersão dos estimadores de localização no espaço binaural foi estudada e explicada pela primeira vez e a hipótese de estacionariedade local do DUET refutada para sons plosivos e sibilantes. O conhecimento adquirido sobre os factores de erro no espaço binaural permitem uma mais robusta localização dos picos, que é o ponto fulcral do DUET. Este conhecimento é extensível a outros métodos. Novas métricas de confiança e distância foram desenvolvidas para a identificação dos picos em tempo real que dispõe de pouca estatística. Um sistema de streaming em tempo real para processamento em paralelo de múltiplas fontes foi desenvolvido.
Separação de fontes, DUET, Reconhecimento de Fala, Processamento de áudio, Processamento de Sinal

Novembro 10, 2014, 11:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Pedro Miguel Félix Brogueira

Departamento de Física (DF)

Professor Associado

ORIENTADOR

Diogo Gonçalo Franco Falcão Osório de Alarcão

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Prof Auxiliar Convidado