Dissertação

Extração Automática de Conteúdos Documentais EVALUATED

Atualmente, devido à grande quantidade de informação disponível em formato de texto, existe uma necessidade crescente de conseguir aceder, tratar e analisar esta informação de forma automática. STRING, a cadeia de processamento de língua natural do L2F, possui alguns dos recursos necessários para processar textos a fim de extrair de forma estruturada a informação neles presente. Esta dissertação descreve algumas das tarefas-chave necessárias para a extração de informação estruturada a partir de textos e apresenta um conjunto de trabalhos que permitem enquadrar melhor este problema. Em seguida, apresentam-se as soluções adotadas no desenvolvimento de um novo módulo da STRING que, utilizando o processamento da cadeia, permite extrair e agregar informação proveniente de textos de forma estruturada. A saída da cadeia é processada e a informação relativa a entidades mencionadas e às relações entre essas entidades, e é então guardada sob a forma de slots. Utilizando um mecanismo de resolução de correferência, estes slots são agregados pela entidade a que dizem respeito e o resultado é devolvido em formato XML.
Processamento de Língua Natural, Extração de Informação, Preenchimento de Slots

Junho 5, 2013, 13:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

CO-ORIENTADOR

Jorge Manuel Evangelista Baptista (Fchs - Universidade do Algarve)

FCHS - Universidade do Algarve

Professor Associado

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado