Dissertação
Autonomous time series data processing on historical and real-time settings EVALUATED
Redes de sensores heterogéneos, incluindo sistemas de distribuição de água e os seus sistemas de monitorização de tráfego, produzem dados de séries temporais abundantes com uma ordem multivariada arbitrariamente alta para monitorizar a dinâmica da rede e detectar eventos de interesse. No entanto, erros e falhas na calibração, armazenamento ou aquisição de dados podem ocorrer em alguns dos sensores instalados nestes sistemas, produzindo valores omissos e/ou anómalos. Esta tese propõe um sistema computacional, para a limpeza totalmente autónoma de dados de séries temporais multivariados usando critérios de qualidade rigorosos avaliados contra os valores reais extraídos dos dados da série alvo, em contextos de dados históricos e em tempo real. A metodologia proposta é livre de parâmetros por se basear em princípios robustos para avaliação, hiperparameterização e seleção de métodos. Este trabalho oferece suporte a um extenso conjunto de métodos do estado da arte para imputação de séries temporais (multivariadas) e deteção e tratamento de valores anómalos, considerando ocorrências pontuais e de segmento/sequência. Uma avaliação abrangente do sistema é realizada usando sensores heterogéneos de dois sistemas de distribuição de água com taxas de amostragem variadas, padrões de consumo de água e inconsistências. Os resultados confirmam a relevância da abordagem proposta de processamento autónomo e a sua extensibilidade para configurações em tempo real sob garantias de otimização.
janeiro 20, 2021, 10:30
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Rui Miguel Carrasqueiro Henriques
Departamento de Engenharia Informática (DEI)
Professor Auxiliar