Dissertação

Open Information Extraction from Dialogue Transcriptions EVALUATED

A Extração Aberta de Informação consiste na tarefa de encontrar uma representação estruturada para as relações e declarações presentes em texto de língua natural, sem usar uma categorização predefinida dos tipos de relações que irão ser extraídos. Ferramentas de extração aberta de informação exploram informação lexical, juntamente com informação sintática e/ou semântica de frases, para procurar relações nelas. Aplicar métodos de extração de informação a transcrições de diálogo, um tipo específico de texto que é menos estruturado e consistente que texto formal, resulta numa redução de desempenho. Para resolver este problema, em primeiro lugar, vamos apresentar um estudo comparativo entre quatro sistemas de extração aberta de informação, nomeadamente os sistemas ReVerb, OLLIE, Stanford OIE e OpenIE 4, com o objetivo de analisar e estudar essa diferença de resultados. Em segundo lugar, iremos implementar uma aplicação que, juntamente com as ferramentas de extração mencionadas, resulta num aumento da precisão em 12 pontos percentuais (pps), de sensibilidade em 11 pps, e de F1-score em 11 pps, para os melhores resultados obtidos, o que melhorou a qualidade das extracções. O nosso sistema pré-processa texto de diálogo antes de este ser passado às ferramentas de extracção, simplificando e dividindo frases usando várias técnicas de processamento de língua natural.
Extração Aberta de Informação, Stanford OpenIE, OpenIE 4, OLLIE, ReVerb, Diálogo em Língua Natural

Outubro 31, 2016, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

David Manuel Martins de Matos

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar