Dissertação

XML Documents Transformation in Large Scale EVALUATED

Extensible Markup Language (XML) é principalmente usado para disseminação de informacão pela internet. No entanto, também pode ser usado com propósitos diferentes, como guardar dados produzidos por ferramentas como as do Microsoft Office. O esquema dos dados pode evoluir com o tempo, e essa evolução pode levar a que os dados fiquem incompatíveis com o esquema. Para evitar essa incompatibilidade, os dados têm que ser transformados. XSLT é uma ferramenta muito usada para fazer transformações em dados, mas para grandes quantidades de dados requer demasiada memória e tempo. Este trabalho tem como objetivo encontrar uma solução para transformar dados produzidos por uma ferramenta de planeamento de redes de fibra ótica que por vezes podem ultrapassar os 3GB. Para aplicar uma transformação num desses ficheiros, Extensible Stylesheet Language Transformations (XSLT) requer cerca de 30 minutos enquanto que, para executar 20 transformações requer cerca de 10 horas. No entanto, se as 20 modificações forem fundidas numa só, a transformação será executada em 30 minutos. Apesar da melhoria, o tempo e memória necessários não são satisfatórios. Para resolver o problema, foi criada uma nova solução baseada em fluxo de dados que permite transformar os mesmos dados em cerca de 3 minutos e a memória necessária é residual.
transformação, migração, esquema, evolução, modelo

Novembro 9, 2015, 10:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Pável Pereira Calado

Departamento de Engenharia Informática (DEI)

Professor Auxiliar