Dissertação

WebJDBC Relational Data Extractor EVALUATED

Um dos objectivos principais de um JDBC driver é aceder a bases de dados relacionais numa aplicação Java. Propõe-se a aceder a páginas Web usando a abstracção das bases de dados relacionais, o que é muito importante quando se pretende construir aplicações que necessitem de integrar múltiplas fontes de informação. Contudo a extracção de dados web não é uma tarefa trivial. Existem muitas páginas web com estrutura HTML diferente e consequentemente com diferentes representações de dados. O objectivo deste trabalho é contribuir com a construção de um WebJDBC driver que possibilite o acesso estruturado e sistemático a dados de páginas web em aplicações Java. A construção do WebJDBC driver dividiu-se em 2 trabalhos distintos: (i) implementação de um extractor de dados web relacionais (ii) implementação de um processador de queries que conseguirá avaliar queries sobre dados obtidos pelo extractor. Este trabalho é focado na implementação do extractor e no estudo de abordagens existentes para a extracção de dados web. O trabalho alcançou a integração de diversas técnicas no Extractor de Dados Web Relacionais que está desenhado de forma facilitar a integração de novas técnicas.
Páginas Web, Extração de dados, Região de dados, Registo de dados, WebJDBC driver, Processamento de Queries

Junho 8, 2012, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Pável Pereira Calado

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Paulo Jorge Fernandes Carreira

Departamento de Engenharia Informática (DEI)

Professor Auxiliar