Dissertação

Symbolic Outlier Detection Applied to the Analysis of Drinking Water Consumption EVALUATED

A análise de componentes principais é um conhecido método estatístico utilizado para redução de dimensionalidade, tendo sido já estendida a dados intervalares por vários autores. Quatro dos métodos de estimação de componentes principais simbólicas mais comuns têm uma formulação unificada, nomeadamente o Método dos Centros, Método dos Vértices, Complete Information Principal Component Analysis e Symbolic Covariance Principal Component Analysis. Um meticuloso estudo de simulação é desenvolvido para comparar diversos estimadores robustos de Componentes Principais simbólicas para dados intervalares, utilizando matrizes de covariância robustas. As versões robustas dos quatro métodos de estimação em estudo são comparadas com as suas congéneres clássicas. O estudo de simulação é acompanhado da visualização dos vários tipos de contaminação utilizados, o que ajuda a entender o que se considera serem anomalias em dados intervalares. Em complemento, foi desenvolvido um método de detecção de anomalias, baseado em componentes principais intervalares robustas. Foi realizado um estudo de comparação inicial para avaliar o desempenho do método proposto, em particular para comparar com outra proposta existente para detecção de anomalias em dados intervalares. As potencialidades das metodologias desenvolvidas são aplicadas a um conjunto de dados reais de consumos de água de mais de 90 000 clientes, servidos por uma extensa rede de abastecimento urbana gerida por uma entidade portuguesa. Utilizando a identificação geográfica dos clientes, os resultados das componentes principais simbólicas são representados em mapas através da utilização do software Baseform. O método de detecção de anomalias desenvolvido é utilizado para identificar e caracterizar clientes com comportamentos de consumo anómalos.
Dados intervalares, componentes principais simbólicas, robustez, consumo de água, sistemas de abastecimento de água

Dezembro 13, 2019, 14:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Maria do Rosário De Oliveira Silva

Departamento de Matemática (DM)

Professor Auxiliar