Dissertação

{en_GB=Open Information Extraction from Dialogue Transcriptions} {} EVALUATED

{pt=A Extração Aberta de Informação consiste na tarefa de encontrar uma representação estruturada para as relações e declarações presentes em texto de língua natural, sem usar uma categorização predefinida dos tipos de relações que irão ser extraídos. Ferramentas de extração aberta de informação exploram informação lexical, juntamente com informação sintática e/ou semântica de frases, para procurar relações nelas. Aplicar métodos de extração de informação a transcrições de diálogo, um tipo específico de texto que é menos estruturado e consistente que texto formal, resulta numa redução de desempenho. Para resolver este problema, em primeiro lugar, vamos apresentar um estudo comparativo entre quatro sistemas de extração aberta de informação, nomeadamente os sistemas ReVerb, OLLIE, Stanford OIE e OpenIE 4, com o objetivo de analisar e estudar essa diferença de resultados. Em segundo lugar, iremos implementar uma aplicação que, juntamente com as ferramentas de extração mencionadas, resulta num aumento da precisão em 12 pontos percentuais (pps), de sensibilidade em 11 pps, e de F1-score em 11 pps, para os melhores resultados obtidos, o que melhorou a qualidade das extracções. O nosso sistema pré-processa texto de diálogo antes de este ser passado às ferramentas de extracção, simplificando e dividindo frases usando várias técnicas de processamento de língua natural., en=Open Information Extraction (Open IE) is the task of finding a structured representation for the relations and assertions present in natural language text, without using a predefined categorization of the relationship types that are to be extracted. OpenIE tools exploit word tokens, together with syntactic and/or semantic information from sentences, to search for relations in them. Applying OpenIE methods to dialogue transcriptions, a specific kind of text that is less structured and consistent than formal text, results in a significant decrease in performance. To address this issue we first present a comparative study between four OpenIE systems, namely ReVerb, OLLIE, Stanford OIE, and OpenIE4, intended to analyze and justify the difference in results. After these initial tests, we implemented an application that, used together with the aforementioned Open IE tools, increases precision by 11 percentage points (pps), recall by up to 12 pps, and F1-score by 11 pps for the best obtained results, which improved the quality of extractions. Our system pre-processes dialogue text before being passed to the extraction tools, by simplifying and dividing the sentences using several natural language processing techniques.}
{pt=Extração Aberta de Informação, Stanford OpenIE, OpenIE 4, OLLIE, ReVerb, Diálogo em Língua Natural, en=Open Information extraction, Stanford OpenIE, OpenIE 4, OLLIE, ReVerb, Dialogue in Natural Language}

outubro 31, 2016, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

David Manuel Martins de Matos

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar