Dissertação
{en_GB=Time series data imputation - Comparison of Dynamic Time Warping with Needleman-Wunsch algorithm} {} EVALUATED
{pt=Os algoritmos de aprendizagem automática estão a ser desenvolvidos e aplicados a dados que ajudam a população nas suas necessidades diárias. Estes algoritmos trazem muitos benefícios a diferentes áreas e possibilitam análises preditivas, formação de grupos de classes (clustering) e classificação dos dados. Podem ser usados, por exemplo, em bases de dados médicas para facilitar o diagnóstico e o tratamento de um paciente. Em relação à eficiência destes algoritmos, existe uma preocupação acrescida no que se refere a valores em falta nos dados. Os algoritmos que existem não estão preparados para lidar com a falta destes dados, pelo que existe a necessidade de se abordar este tema. Assim, neste trabalho, pretende-se comparar dois algoritmos de imputação de dados que poderão ser usados para completar os dados em falta. Os algoritmos usados são o Dynamic Time Warping e Needleman-Wunsch. Verificou-se que estes dois algoritmos são capazes de preencher os dados em falta, onde o Dynamic Time Warping se revelou mais preciso, enquanto que o Needleman-Wunsch se revelou mais rápido. Com este trabalho também se verificou que estes dois algoritmos podem ser testados em mais profundidade devido ao seu potencial para preencher os dados em falta. Também são feitas sugestões para melhorar alguns pontos menos positivos em relação à performance dos mesmos., en=Machine learning algorithms are now being designed and applied to data to help humans in their everyday needs. These algorithms can bring major benefits to many areas and are capable of conducting predictions, clustering and classification on data. They could be used, for example, on medical databases to help in treatments and diagnosis of patients. One major concern that threatens the efficiency of these algorithms are missing values. Many algorithms which are in place today are not prepared to handle these missing values, which means they have to be handled in other ways. In this paper it is aimed to compare two imputation algorithms that could be used in filling these missing values. Both methods use sequence alignment to find matches with which the missing values could then be imputed. One of the algorithms uses dynamic time warping while the other uses Needleman-Wunsch. Both of these algorithms were suitable when it came to data imputation. Imputation done using dynamic time warping was accurate, although it lacked in speed, while the Needleman-Wunsch imputation was faster, but not quite as accurate as the dynamic time warping imputation. The results show that both of these algorithms should be further tested due to their potential in the imputation of values, as well as some suggestions to strengthen the weaknesses of both of these algorithms.}
novembro 22, 2019, 17:30
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Susana de Almeida Mendes Vinga Martins
Departamento de Bioengenharia (DBE)
Professor Associado
ORIENTADOR
Alexandra Sofia Martins de Carvalho
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Auxiliar