Dissertação

{en_GB=Model-based Learning in Multivariate Time Series} {} EVALUATED

{pt=Séries temporais multivariadas são um tópico muito ativo na comunidade de científica e muitas tarefas de aprendizagem automática são usadas para extrair informações desse tipo de dados. No entanto, no mundo real existem muitos problemas, os dados podem ter valores ausentes e pode não haver informações prévias sobre os grupos, o que pode dificultar a aplicação destas técnicas. Assim, esta tese incidirá sobre tarefas de imputação e agrupamento. Muitos métodos de imputação de séries temporais são baseados em métodos de regressão; no entanto, esse tipo de método não consegue capturar as relações entre as variáveis das séries temporais categóricas multivariadas. Como tal, esta tese propõe um novo método de imputação baseado em Dinamic Bayesian Networks. A tarefa de clustering tenta agrupar séries temporais semelhantes. Os métodos de estado da arte podem ser divididos em dois tipos: os que usam uma distância personalizada e depois usam um método de agrupamento tradicional como k-means; e os que usam modelos para agrupar séries temporais semelhantes. No entanto, a maioria desses métodos não têm em consideração a relação entre as variáveis. Como tal, esta tese propõe um novo método de clustering que use Dinamic Bayesian Multinets para agrupar séries temporais similares. Os métodos propostos são avaliados em dados sintéticos, mostrando que supera os métodos de estado da arte, em ambas as tarefas. Outros testes experimentais são realizados utilizando conjuntos de dados reais, sendo que é mostrado que os métodos propostos são mais consistentes do que os métodos de estado da arte., en=Multivariate time series is a very active topic in the research community and many machine learning tasks are being used in order to extract information from this type of data. However, in real-world problems, the data has missing values and may lack prior information about the groups, which may difficult the application of machine learning techniques to extract information. Hence, this thesis will focus on the tasks of imputation and clustering. Many imputation methods of time series are based on regression methods; however, these type of methods cannot capture the information between the variables of multivariate categorical time series. As such this thesis proposes a new imputation method that uses the Dynamic Bayesian Networks. The task of clustering tries to group similar time series. State of the art methods can be divided in two types: the ones that use a custom distance and then use a traditional clustering method like k-means; and the ones that use models to cluster similar time series. However, most of these methods do not take into consideration the relationship between variables. As such, this thesis proposes a new clustering method based on Dynamic Bayesian Multinets to cluster similar time series. The devised methods are assessed in synthetic data, showing that it outperforms the state of the art methods, in both tasks. Further experimental tests are done using real datasets, where it is shown that the proposed methods are more consistent than the state of the art methods in their tasks.}
{pt=Clustering, Imputação, Séries Temporais Multivariadas, Redes de Bayes Dinâmicas, Variáveis discretas, en=Clustering, Imputation, Multivariate Time Series, Dynamic Bayesian Networks, Discrete Variables}

Novembro 9, 2018, 9:30

Orientação

ORIENTADOR

Alexandra Sofia Martins de Carvalho

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar

ORIENTADOR

Helena Isabel Aidos Lopes

FCUL

Professor Auxiliar