Dissertação

Developing Process Mining Tools: An Implementation of Sequence Clustering for ProM An Implementation of Sequence Clustering for ProM EVALUATED

O objectivo da extracção de processos é obter informação relevante a partir dos logs de eventos que registam actividades executadas numa organização. Existem várias técnicas nesta área que a partir desses logs geram modelos de processos. Estas técnicas apresentam bons resultados em processos bem estruturados, mas têm problemas quando aplicadas a processos pouco estruturados, onde os logs são muito confusos e têm grandes quantidades de ruído, dificultando a extracção de informação útil. O modelo gerado é difícil de compreender e poderá incluir comportamento de casos bastante distintos. Neste trabalho apresentamos uma abordagem que visa ultrapassar estas dificuldades, extraindo apenas a informação relevante e apresentando-a de forma legível. Para isso algoritmos de clustering de sequências são utilizados para dividir o log em logs mais pequenos (clusters) que correspondem a um conjunto de casos relacionados. Para cada cluster, um modelo em forma de cadeia de Markov é apresentado. Desenvolveu-se também uma fase de pré-processamento, para limpar o log de elementos que poderão complicar desnecessariamente os modelos obtidos. A abordagem foi implementada na ferramenta ProM e todas as experiências foram executadas nesse ambiente. Tendo em conta os resultados obtidos num caso de estudo real e os resultados de diversas experiências, conclui-se que a abordagem é capaz de lidar com logs complexos, eliminando comportamento desnecessário e dividindo diferentes tipos de comportamento em modelos mais compreensíveis. Também se conclui que o algoritmo de clustering de sequências apresenta bons resultados quando comparado a outros algoritmos de clustering ao dividir sequências no contexto da extracção de processos.
Extracção de Processos, Pré-processamento, Clustering de Sequências, ProM, Cadeias de Markov, Logs de Eventos, Clustering Hierárquico, Modelos de Processos

outubro 7, 2009, 10:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Diogo Manuel Ribeiro Ferreira

Departamento de Engenharia Informática (DEI)

Professor Auxiliar