Dissertação

Clustering multivariate time series using dynamic Bayesian networks EVALUATED

As séries temporais multivariadas são extremamente utilizadas hoje em dia por serem uma forma conveniente de organizar e guardar grandes quantidades de informação. Nesta tese descrevemos o algoritmo CRATES, que lida especificamente com os problemas relacionados com fazer clusters de dados expressos em séries temporais multivariadas. Estes problemas são maioritariamente causados pela possível existência de valores não numéricos nas séries temporais, dificultando bastante o processo de clustering. Propomos uma alternativa a um método já existente que oferecia uma solução interessante ao usar Hidden Markov Models para modular cada série temporal, assim como a distância estatística de Kullback-Leibler para conseguir a matriz de distancias usada para fazer o clustering. No nosso caso, propomos a utilização de Redes de Bayes Dinâmicas em vez de Modelos de Markov e usamos várias outras distâncias estatísticas. Assim, melhoramos a qualidade dos clusters e removemos algumas imperfeições inerentes do algoritmo original. O CRATES foi primeiramente testado com dados sintéticos com o intuito de mostrar o seu potencial, seguido de testes em várias bases de dados reais, nos quais comparamos os resultados obtidos com outros do estado da arte usando indices de validação conhecidos para mostrar que o algoritmo proposto é competitivo, tendo um enorme potencial.
Clustering, Séries Temporais Multivariadas, Redes de Bayes Dinâmicas, Validação de Clusters

outubro 22, 2020, 14:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Susana de Almeida Mendes Vinga Martins

Departamento de Bioengenharia (DBE)

Professor Associado

ORIENTADOR

Alexandra Sofia Martins de Carvalho

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar