Dissertação

{en_GB=Multivariate Correlations for Early Classification} {} EVALUATED

{pt=As séries temporais multivariadas estão presentes em diferentes aplicações de Data Mining, onde uma ou diversas variáveis são analisadas ao longo do tempo. Early classification (EA) pode ser entendida como uma extensão do problema de classificação de séries temporais, em cujo objetivo é obter uma previsão confiável o mais cedo possível. Em dados temporais, a ordem das observações é crucial, uma vez que uma determinada sequência de ocorrências pode ser o fator distintivo e discriminante. O mesmo acontece com a EA, onde o objetivo é usar a menor quantidade possível de informação, garantindo uma precisão satisfatória. As correlações entre as variáveis das séries temporais multivariadas, associadas a diferentes instantes de tempo, podem fornecer conhecimento acerca de dependências preditivas e relações que podem ser exploradas. Um método baseado em teoria da informação, que analisa a oportunidade de EA num conjunto de séries temporais com as suas respetivas classes, é proposto, implementado e avaliado. O objetivo do algoritmo Multivariate Correlations for Early Classification (MCEC) é identificar o instante de tempo prematuro para o conjunto total de dados, a partir do qual a restante informação pode ser ignorada, obtendo-se ainda assim uma previsão razoável. Foram realizados testes de validação experimentais em dados sintéticos, simulados e reais. A abordagem proposta obteve bons resultados, os quais foram confirmados com recurso a significância estatística, no que diz respeito ao balanço entre precisão e precocidade, dois dos desafios fundamentais em EA. Esta metodologia pode também ser considerada uma alternativa relevante para procedimentos de seleção de atributos. , en=Multivariate time series are found in several data mining applications, where one or multiple variables are analysed over time. Early classification arises as an extension of the time series classification problem, in view of obtaining a reliable prediction as soon as possible. In temporal data, the order of the observations is critical, given that a particular sequence of occurrences can be the distinctive and discriminative factor. The same is true for early classification, where the goal is to use as less information as possible, ensuring a decent accuracy. The correlations between the variables of the multivariate time series from different time points may provide insights into predictive dependencies and relationships to be exploited. And here is where multivariate correlations and early classification come together. An information-theoretic method for investigating the early classification opportunity from a collection of time series together with their respective class labels is proposed, implemented and assessed. The goal of the Multivariate Correlations for Early Classification (MCEC) algorithm is to identify the early classification time point for the entire dataset, from which the remaining information can be neglected and still obtain a satisfactory prediction. Experimental validation tests are performed on synthetic, simulated and real data. The proposed approach achieved good results, which were confirmed with statistical significance, concerning a tradeoff between accuracy and earliness, the two fundamental challenges in early classification. This methodology can be considered a relevant alternative, not only for the early classification context, but also for feature selection procedures.}
{pt=classificação antecipada, correlações multivariadas, informação mútua, entropia condicional, critério de informação de Akaike, descrição de comprimento mínimo, en=early classification, multivariate correlations, mutual information, conditional entropy, Akaike information criterion, minimum description length}

Maio 30, 2018, 17:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Paulo Alexandre Carreira Mateus

Departamento de Matemática (DM)

Professor Associado

ORIENTADOR

Alexandra Sofia Martins de Carvalho

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar