Dissertação

Symbolic clustering and anomaly detection for business analytics EVALUATED

Plataformas de integração são um ponto de passagem de muita informação relevante sobre o processo de negócio de uma empresa, vinda de diversos sistemas externos. O objectivo passa por entender os padrões dos utilizadores e serviços e detectar quando é que estes apresentam um padrão anormal. Para isso, analisaram-se os log-files gerados, quase continuamente, de dados provenientes de uma plataforma de integração, sempre que um processo termina, contendo informação sobre estes. Esta análise tem interesse comercial, pois permite melhorar a qualidade do serviço providenciado pela empresa. Cada objecto (cliente ou serviço) é sumariado, através de intervalos (abordagem simbólica) ou de estatísticas descritivas (abordagem convencional), em períodos de dez minutos, com base nas suas durações de processos. Conforme o método de agregação escolhido, usaram-se para obter grupos homogéneos de objectos os algoritmos "Symbolic Clustering" e "Partition Around Medoids", respectivamente. Estes grupos são obtidos diariamente ou ao fim de oito dias. Para ambas as abordagens, foram aplicados métodos de detecção de anomalias baseados na distância de Mahalanobis robusta. Como a granularidade diária é elevada, e é importante detectar as anomalias com maior rapidez, desenvolveu-se um algoritmo baseado na análise de componentes principais robustas, devolvendo a cada dez minutos a lista das anomalias identificadas.
Clustering, Detecção de anomalias, Análise de dados simbólicos, Dados em stream

Dezembro 10, 2018, 11:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Maria do Rosário De Oliveira Silva

Departamento de Matemática (DM)

Professor Auxiliar

ORIENTADOR

Maria da Conceição Esperança Amado

Departamento de Matemática (DM)

Professor Auxiliar