Dissertação

Limpeza de dados XML EVALUATED

A eXtended Markup Language (XML) é atualmente a linguagem de eleição para armazenar e transmitir dados através de diversos domínios aplicacionais. Para além disto, o XQuery tem vindo a surgir como uma abordagem poderosa e padronizada para realizar consultas em documentos XML. Contudo, e apesar da sua expressividade, o XQuery ainda apresenta alguns problemas relativos à eficiência com que lida com problemas de limpeza de dados. A limpeza de dados refere-se ao processo de correção de anomalias existentes em bases de dados, que podem dever-se, por exemplo, a erros ortográficos ou representações duplicadas de objetos do mundo real. Com o crescimento da quantidade de dados XML, abordagens para realizar limpeza de dados XML de forma eficiente e eficaz são claramente necessárias. Apesar desta necessidade, a grande maioria dos sistemas de limpeza de dados não permite a limpeza de dados XML, especializando-se na limpeza de dados relacionais. Esta tese defende a utilização do XQuery com uma extensão de funções para permitir a limpeza de dados XML. Neste documento são discutidas as vantagens desta abordagens, são introduzidos alguns cenários de utilização desta extensão do XQuery, é detalhado o conjunto de funções existentes na extensão criada e é realizada uma comparação entre esta abordagem e outras formas de desempenhar limpeza de dados XML.
Limpeza de Dados, XML, XQuery, Qualidade de Dados

Junho 4, 2013, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Helena Isabel De Jesus Galhardas

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar