Dissertação

OntoC4S framework: constraint based framework for sequential pattern mining EVALUATED

Atualmente, a informação é omnipresente e todas as pessoas lhe podem aceder. É caracterizada pela sua diversidade e heterogeneidade. Como consequência, existe o desafio de obter informação útil de toda esta informação. A área interdisciplinar da data mining surge como um processo computacional de extração de informação útil de toda esta informação e a sua transformação numa estrutura adequada para a tomada de decisões. O pattern mining é um subtópico para a obtenção de conhecimento na forma de padrões. As restrições foram identificadas como uma ferramenta para a orientação dos algoritmos de pattern mining dentro das expectativas dos utilizadores mas até hoje a sua expressividade tem sido limitada pelas ferramentas utilizadas na sua definição. As ontologias foram identificadas como um caminho para a representação de conhecimento de domínio. Neste trabalho, desenvolveu-se uma framework baseada numa ontologia para o processo de sequential pattern mining, a framework OntoC4S, na definição de conhecimento de domínio através das especificações do utilizador. É capaz de representar eventos sequenciais e paralelos, de modo a possibilitar a definição de restrições sobre dados sequenciais. O objetivo é permitir a representação de restrições mais expressivas quando comparada com outras representações e alargar a possibilidade de integração de conhecimento ao mesmo tempo que otimiza os algoritmos atuais. Os resultados mostram que a framework atinge os objetivos enquanto mantém a performance dos algoritmos sem restrições. Este trabalho está inserido no projeto D2PM onde uma framework para a orientação dos algoritmos de pattern mining é o objetivo a atingir.
Data Mining, Pattern Mining, Restrições, Ontologia, OntoC4S framework, SeqD2PrefixGrowth

Outubro 31, 2014, 15:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Claudia Martins Antunes

Departamento de Engenharia Informática (DEI)

Professor Auxiliar