FenixEdu™

Dissertação

{en=Extraction of non-taxonomic relations from texts to enrich a basic ontology} {} EVALUATED

Detalhes: {pt=A construção manual de ontologias é uma tarefa cara e demorada, porque os profissionais necessários para essa tarefa (ou seja, especialistas de domínio e engenheiros do conhecimento) geralmente são altamente especializados. O desenvolvimento de ontologias rápido e barato é crucial para o sucesso de aplicações baseadas no conhecimento e de Semantic Web. Ontology learning fornece processos automáticos ou semi-automáticos para a construção de ontologias. Neste processo, a extração de relações não taxonómicas foi identificado como um dos problemas mais difíceis e muitas vezes negligenciado. Nesta tese, apresentamos uma framework para implementar uma abordagem não supervisionada para esta tarefa. Dada uma ontologia de domínio e um corpus de dominio específico, a nossa abordagem enriquece a ontologia adicionando relações não taxonómicas extraídas do corpus de domínio específico. Vamos explorar os métodos de extração baseados em verbos, pois os verbos são fontes valiosas para recuperar relações entre as entidades. A nossa framework foi testada em dois domínios distintos (o domínio do ténis e o domínio das biografias de atores). O objetivo principal é reduzir a carga de trabalho de engenheiros do conhecimento e especialistas de domínio, sugerindo relações candidatas que podem se tornar parte da ontologia, bem como as palavras que marcam essas relações., en=Manual construction of ontologies is an expensive and time consuming task because the professionals required for this task (i.e. domain specialists and knowledge engineers) usually are highly specialized. The fast and cheap ontology development is crucial for the success of knowledge based applications and the Semantic Web. Ontology learning provides automatic or semi-automatic processes for ontology construction. In these processes, the extraction of non-taxonomic relations has been identified as one of the most difficult and often neglected problems. In this thesis, we present a framework to implement an unsupervised approach for this task. Given a domain ontology and a domain specific corpus, our approach enriches the ontology by adding non-taxonomic relations extracted from the domain specific corpus. We explore the trend of verb-based extraction methods because verbs are invaluable sources of evidence for retrieving relations among entities. We have tested our framework in two distinct domains (the tennis sport domain and the biographies of movie actors domain). The main objective is reducing the work-load of knowledge engineers and domain experts by suggesting candidate relations that might become part of the ontology as well as prospective labels for them.}
Keywords: {pt=Ontology Learning, Extração de Relações, Relações Não-taxonómicas, Processamento de Língua Natural., en=Ontology Learning, Relation Extraction, Non-taxonomic Relations, Natural Language Processing.}

Discussão: junho 2, 2014, 13:0