Dissertação

{en_GB=Outlier detection for multivariate time series} {} EVALUATED

{pt=Outliers podem ser definidos como observações suspeitas de não terem sido geradas pelos processos subjacentes aos dados. Muitas aplicações exigem uma forma de identificar padrões interessantes ou incomuns em séries temporais multivariadas (STM), no entanto, a maioria dos métodos de deteção concentram-se exclusivamente em séries univariadas, fornecendo aos analistas soluções extenuantes. Propomos um sistema completo de deteção de outliers abrangendo problemas desde o pré-processamento que adota um algoritmo de modelação de redes de Bayes dinâmicas. O mesmo codifica as conectividades inter e intra-temporais ótimas de redes de transição, capazes de identificar dependências condicionais em STM. Um mecanismo de janela deslizante é empregado para capturar gradualmente o score de cada transição de uma STM dado o modelo. Simultaneamente, STM inteiras são avaliadas. Duas estratégias de análise de scores são estudadas para assegurar uma classificação automática de dados anomalos. A abordagem proposta é primeiramente validada através de dados simulados, demonstrando o desempenho do sistema. Comparação com um método de árvore probabilistica de sufixos está disponível exibindo a vantagem da abordagem multivariada proposta. Experiências adicionais são feitas em dados reais, revelando anomalias em cenários distintos, como séries de eletrocardiogramas, dados de taxas de mortalidade e escrita de dígitos. O sistema desenvolvido mostrou-se benéfico na captura de outliers resultantes de contextos temporais, sendo adequado para qualquer cenário que emprega STM. Uma aplicação web de livre acesso, empregando o sistema completo, é disponibilizada em conjunto com um tutorial., en=Outliers can be defined as observations which are suspected of not have been generated by data's underlying processes. Many applications require a way of identifying interesting or unusual patterns in multivariate time series (MTS), however, most outlier detection methods focus solely on univariate series, providing analysts with strenuous solutions. We propose a complete outlier detection system covering problems since pre-processing that adopts a dynamic Bayesian network modeling algorithm. The latter encodes optimal inter and intra time-slice connectivity of transition networks capable of capturing conditional dependencies in MTS datasets. A sliding window mechanism is employed to gradually score each MTS transition given the model. Simultaneously, complete MTS are evaluated. Two score-analysis strategies are studied to assure an automatic boundary classifying anomalous data. The proposed approach is first validated through simulated data, demonstrating the system's performance. Comparison with an assembled probabilistic suffix tree method is available displaying the leverage of the proposed multivariate approach. Further experimentation is made on real data, by uncovering anomalies in distinct scenarios such as electrocardiogram series, mortality rate data and written pen digits. The developed system proved beneficial in capturing unusual data resulting from temporal contexts, being suitable for any MTS scenario. A widely accessible web application employing the complete system is made available jointly with a tutorial.}
{pt=séries temporais multivariadas, detecção de outliers, redes de Bayes dinâmicas, algoritmo de janela deslizante, analise de resultados, aplicação web, en=multivariate time series, outlier detection, dynamic Bayesian networks, sliding window algorithm, score analysis, web application}

Novembro 29, 2018, 11:0

Orientação

ORIENTADOR

Susana de Almeida Mendes Vinga Martins

Departamento de Bioengenharia (DBE)

Professor Associado

ORIENTADOR

Alexandra Sofia Martins de Carvalho

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar