Dissertação

{en=Voice Source Assessment: Jitter Evaluation on Normal and Pathological Voices} {en=Jitter Evaluation on Normal and Pathological Voices} EVALUATED

{pt=O objectivo deste trabalho consiste no estudo de vários métodos de estimação de jitter sobre o sinal glotal produzido durante a vibração das cordas vocais. O valor de jitter mede a diferença de duração entre períodos consecutivos e é considerado um bom indicador de patologia ao nível das cordas vocais. Alguns algoritmos standard de estimação de jitter foram inicialmente implementados e testados com sinais sintéticos, tendo os seus resultados sido comparados com software já disponível tal como o Praat e o MDVP. A localização do instante de fecho glotal, em cada ciclo glotal, consiste no primeiro passo de alguns métodos de estimação de jitter. Uma transformação ao algoritmo dypsa, chamado dipsaMP, foi desenvolvida e apresentou uma melhoria em média de 30% sobre a versão inicial. O próximo passo foi avaliar a capacidade de cada algoritmo em distinguir voz patológica de voz não patológica. Para tal, 100 vozes foram escolhidas aleatoriamente da base de dados MEEI e utilizadas num processo de ajuste de paramento utilizando uma validação cruzada com 10 iterações. Um valor de threshold foi encontrado para cada algoritmo e posteriormente utilizado para avaliação numa nova base de dados concebida durante este trabalho. O estimador sugerido, chamado LocJitta, demonstrou a melhor performance na detecção de vozes patológicas, com uma taxa de acerto de 85% na base de dados da MEEI, ultrapassando os resultados obtidos com os sistemas Praat e MDVP. , en=The present work focuses on the study of different methods to estimate the amount of jitter in the source signal produced by the vibration of the vocal folds. The jitter value measures the difference in the duration of consecutive glottal cycles and is considered a good indicator of the presence of pathologies in the vocal folds. Some standard jitter estimation methods were implemented and initially tested on synthetic voices to evaluate their performance and to compare their performance with already available software like Praat and MDVP. The location of the glottal closure instant in each glottal cycle is, for some of the methods, the first step in the jitter estimation process. A variation of the dypsa algorithms, called dypsaMP, was developed and showed an average 30% improvement over the baseline version. The next step was to evaluate the ability of the jitter estimators to classify voices as pathological or non-pathological. For this purpose, 100 voices from the MEEI database were randomly selected and used to tune the classification threshold for each estimator using a 10-fold cross-validation method. The jitter estimators were also evaluated on a new voice database acquired in the scope of this work. The new estimator, named LocJitta, achieved the best performance in the detection of pathological voices on the MEEI database, with an accuracy of around 85% outperforming the results achieved using the estimators of MDVP and Praat. }
{pt=Análise Acústica, Detector dos Instantes de Fecho Glotal, Estimação do Jitter, Criação da Base de Dados, Método da Validação Cruzada 10-Fold., en=Acoustic Analysis, Glottal Closure Instant Detection, Jitter Estimation, Database Conceptualisation, 10-fold Cross-Validation.}

outubro 29, 2008, 10:0

Orientação

CO-ORIENTADOR

Mário Andrea

Faculdade de Medicina da Universidade de Lisboa

Professor Catedrático

ORIENTADOR

Luís Miguel Veiga Vaz Caldas de Oliveira

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar