Dissertação

{en_GB=Data Extraction and Integration for the Creation of a Database Describing Portuguese Unions and other Social Partners} {} EVALUATED

{pt=O desenvolvimento de uma base de dados completa e consistente levanta muitos desafios, relacionados à coleta e integração de dados de várias fontes. A DGERT (Direção-Geral do Emprego e das Relações de Trabalho) é responsável pela publicação de um boletim oficial semanal com informações detalhadas sobre as organizações de trabalho e sobre as suas atividades. Este instituto também possui informações sobre organizações sindicais e patronais em diferentes fontes de dados. No âmbito deste trabalho, foi desenvolvida uma base de dados sobre organizações sindicais e patronais portuguesas, juntamente com uma interface web de apoio à exploração dos dados. A base de dados desenvolvida contém informações obtidas a partir das diferentes fontes de dados disponibilizadas pela DGERT. A base de dados foi desenvolvida através de procedimentos de extração de informação e integração de dados, visando o apoio a diferentes estudos nas ciências sociais. Para o desenvolvimento da interface web, foi utilizada a framework Flask. O desenvolvimento da base de dados envolveu múltiplas pequenas tarefas. Futuramente, é possível aprimorar essas tarefas, de forma a melhorar a quantidade de dados e a qualidade da base de dados., en=The development of a complete and consistent database raises many challenges, related to data collection and integration from multiple sources. The DGERT (Direção-Geral do Emprego e das Relações de Trabalho) institute is responsible for publishing a weekly official bulletim with detailed information on work-related organizations and on their activities. This institute also has information on trade-unions and employer organizations in different data sources. In the context of this work, was developed a database on Portuguese labor unions and employer organizations, together with a web-based interface supporting the exploration of the data. The developed database contains information obtained from the different data sources available from DGERT institute. The database was developed through information extraction and data integration procedures, envisioning the support to different studies in the social sciences. For the development of the web-based interface, the Flask web framework was used. The database development involved multiple small tasks. In the future it is possible to enhance those tasks, in order to improve the amount of data and the quality of the database.}
{pt=Extração de dados, Limpeza de dados, Integração de dados, Serviço web, Aplicação web, en=Data extraction, Data cleaning, Data integration, Web service, Web application}

Janeiro 18, 2021, 9:0

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

José Luís Brinquete Borbinha

Departamento de Engenharia Informática (DEI)

Professor Associado