Dissertação

Support for User Interaction in a Data Cleaning Process EVALUATED

Transformações de dados que permitam limpar dados sujos são difíceis de criar, assim como o afinar destas transformações é complicado pela falta de ferramentas que suportem a deteção de problemas de qualidade de dados durante fases intermédias do processo de limpeza de dados. Para além disso, muitas vezes não se conseguem obter soluções de limpeza completamente automáticas tornando-se necessário envolver os utilizadores para que estes resolvam alguns problemas. Tal como proposto em [Galhardas et al., 2011], para melhor suportar o envolvimento do utilizador em processos de limpeza de dados, a limpeza definida à custa de grafos de transformações pode ser aumentada com restrições de qualidade de dados que ajudam os utilizadores a identificar pontos nas transformações e registos que requerem a sua atenção, assim como reparações manuais de dados para representar a forma como os utilizadores podem fornecer a informação necessária para a limpeza manual de alguns dados. Nesta tese, propõe-se a concretização destes conceitos no contexto do AJAX – uma ferramenta de limpeza de dados preexistente que funciona com grafos de limpeza de dados – e a descrição da implementação do CLEENEX, um protótipo que implementa a solução proposta. O CLEENEX providencia uma prova-de-conceito para a integração de restrições de qualidade de dados e reparações manuais de dados em programas de limpeza de dados, demonstrando a viabilidade da aproximação proposta em [Galhardas et al., 2011] para o envolvimento de utilizadores em limpeza de dados. Para além disso, o CLEENEX é instrumental na avaliação desta aproximação.
limpeza de dados, grafos de limpeza de dados, envolvimento do utilizador

Outubro 30, 2012, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Maria Antónia Bacelar da Costa Lopes

FCUL

Professor Associado

ORIENTADOR

Helena Isabel De Jesus Galhardas

Departamento de Engenharia Informática (DEI)

Professor Auxiliar