Dissertação
Extracting Relationships and Network Structures from Text EVALUATED
O facto de informação disponível na internet aumentar exponencialmente de dia parta dia, torna cada vez mais interessante a investigação de temas como extração de relações entre entidades em documentos de texto, nomeadamente entre pessoas e entre locais. Este trabalho de investigação está dividido em dois objectivos. O primeiro está relacionado com o estudo de técnicas que permitam extração de relações em texto escritos em Portugûes, apontando ao desenvolvimento de um sistema capaz de extrair relações de polaridade entre pares de pessoas. O segundo objectivo, refere-se á utilização desse mesmo sistema, com algumas adaptações, para efectuar extração de relações entre pares de locais, mencionados em livros de ficção escritos em Inglês, onde um local é "parte de" outro (por exemplo, Lisboa "parte de" Portugal). Este trabalho, refere também uma abordagem para reconhecimento de entidades em textos escritos em Português, que será utilizada para identificar as pessoas nos textos utilizados no primeiro objectivo. Esta dissertação formaliza assim abordagens para reconhecimento de entidades mencionadas e extração de relações, apresentando um eficiente sistema para reconhecimento de entidades em documentos de texto em Português. É ainda apresentada uma descrição do sistema de extração de relações que foi desenvolvido. Este sistema, é a extensão de um algoritmo proposto anteriormente, o Snowball. É também efectuada uma validação experimental às duas versões do sistema de extração de relações, utilizando o jornal Público para a extração de relações de suporte e oposição e livros de geografia e ficção para a extração de relações entre locais.
novembro 10, 2014, 18:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar