Dissertação

{en_GB=Linked Product Data} {} EVALUATED

{pt=Ao longo dos anos a Web tornou-se um lugar acessível para todos e esse facto foi responsável pela quantidade crescente de dados disponíveis hoje. O slogan AAA - “Anyone can say Anything about Any topic”, que significa que qualquer um pode dizer qualquer coisa sobre qualquer assunto descreve bem a natureza aberta da Web. Na tão conhecida “Web of data” a tarefa de pesquisa tem-se tornado cada vez mais difícil. Quando alguém realiza uma pesquisa num motor de busca, como o Google, várias páginas da web são retornadas, as quais estão relacionadas com a mesma pelas palavras dadas pelo utilizador. Contudo, a maioria das páginas retornadas pela web não possuem uma estrutura de dados bem definida, o que torna difícil a referenciação da informação e sua comparação quando provêm de diferentes fontes. O objectivo deste trabalho foi assim desenvolver um motor de mapeamento de identidade entre entidades informacionais, com base em tecnologias de Web Semântica, capazes de encontrar semelhanças entre os dados que são mantidos em diferentes fontes de dados e apresentados em diferentes páginas, e decidir quais dessas fontes fazem referência ao mesmo objecto do mundo real. Com essa informação, será possível criar vínculos entre essas diferentes fontes de dados e oferecer informações mais ricas aos utilizadores, através da fusão de informação disjunta. Uma aplicação de mapeamento e fusão de dados de produtos na Web foi desenvolvida e avaliada em diferentes cenários., en=Over the years, the Web has become a place accessible to everyone and that fact was responsible for the increasing amount of data that is available today. The AAA slogan which means that ``Anyone can say Anything about Any topic'' describes the open nature of the Web. In this so-called ``Web of Data'' the task of search is becoming harder. When someone performs a search in an engine, like Google, several web pages are returned, that are related to the search by the words given by the user, but most of those web pages are documents without a well defined data schema. This makes it difficult to reference information and to compare it accurately when it comes from different sources. The aim of this work was to develop an identity mapping engine for informational entities based on Semantic Web Technologies that can find similarities between data that is kept in different data sources and presented in different web sites, and decide which of these sources are referencing the same real world objects. With that information it is possible to create links between the different data sources and offer richer information to the users, by merging disjoint information. An application for mapping and merging product data in the Web was developed and evaluated, in different scenarios.}
{pt=Associação de dados, mapeamento de identidade, Semantic Web, RDF, SPARQL., en=Linked data, identity mapping, Semantic Web, RDF, SPARQL.}

Maio 23, 2016, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Miguel Filipe Leitão Pardal

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

José Manuel da Costa Alves Marques

Departamento de Engenharia Informática (DEI)

Professor Catedrático