Dissertação
Clustering multivariate time series using dynamic Bayesian networks EVALUATED
As séries temporais multivariadas são extremamente utilizadas hoje em dia por serem uma forma conveniente de organizar e guardar grandes quantidades de informação. Nesta tese descrevemos o algoritmo CRATES, que lida especificamente com os problemas relacionados com fazer clusters de dados expressos em séries temporais multivariadas. Estes problemas são maioritariamente causados pela possível existência de valores não numéricos nas séries temporais, dificultando bastante o processo de clustering. Propomos uma alternativa a um método já existente que oferecia uma solução interessante ao usar Hidden Markov Models para modular cada série temporal, assim como a distância estatística de Kullback-Leibler para conseguir a matriz de distancias usada para fazer o clustering. No nosso caso, propomos a utilização de Redes de Bayes Dinâmicas em vez de Modelos de Markov e usamos várias outras distâncias estatísticas. Assim, melhoramos a qualidade dos clusters e removemos algumas imperfeições inerentes do algoritmo original. O CRATES foi primeiramente testado com dados sintéticos com o intuito de mostrar o seu potencial, seguido de testes em várias bases de dados reais, nos quais comparamos os resultados obtidos com outros do estado da arte usando indices de validação conhecidos para mostrar que o algoritmo proposto é competitivo, tendo um enorme potencial.
outubro 22, 2020, 14:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Susana de Almeida Mendes Vinga Martins
Departamento de Bioengenharia (DBE)
Professor Associado
ORIENTADOR
Alexandra Sofia Martins de Carvalho
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Auxiliar