Dissertação
Limpeza de dados XML EVALUATED
A eXtended Markup Language (XML) é atualmente a linguagem de eleição para armazenar e transmitir dados através de diversos domínios aplicacionais. Para além disto, o XQuery tem vindo a surgir como uma abordagem poderosa e padronizada para realizar consultas em documentos XML. Contudo, e apesar da sua expressividade, o XQuery ainda apresenta alguns problemas relativos à eficiência com que lida com problemas de limpeza de dados. A limpeza de dados refere-se ao processo de correção de anomalias existentes em bases de dados, que podem dever-se, por exemplo, a erros ortográficos ou representações duplicadas de objetos do mundo real. Com o crescimento da quantidade de dados XML, abordagens para realizar limpeza de dados XML de forma eficiente e eficaz são claramente necessárias. Apesar desta necessidade, a grande maioria dos sistemas de limpeza de dados não permite a limpeza de dados XML, especializando-se na limpeza de dados relacionais. Esta tese defende a utilização do XQuery com uma extensão de funções para permitir a limpeza de dados XML. Neste documento são discutidas as vantagens desta abordagens, são introduzidos alguns cenários de utilização desta extensão do XQuery, é detalhado o conjunto de funções existentes na extensão criada e é realizada uma comparação entre esta abordagem e outras formas de desempenhar limpeza de dados XML.
junho 4, 2013, 10:30
Publicação
Obra sujeita a Direitos de Autor
Orientação
CO-ORIENTADOR
Helena Isabel De Jesus Galhardas
Departamento de Engenharia Informática (DEI)
Professor Auxiliar
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar