Dissertação

Keyphrase Extraction and Geospatial Characterizations for the Usage of Keyphrases EVALUATED

A extracção de palavras chaves é uma tarefa importante no processamento de lingua natural. Palavras chaves podem, por exemplo, facilitar o processo de resumir uma colecção de documentos ao descreverem cada documento com concisão. Adicionalmente, estas facilitam o processo de visualização de padrões que existem em documentos textuais, além de facilitar outras tarefas, como categorização, agrupamento, indexação e pesquisa. Este projecto avança uma proposta para um novo método não supervisionado para a extracção de palavras chave, combinando uma abordagem baseada em medidas de centralidade sobre um grafo ponderado com técnicas de modelos linguísticos. O novo método avança uma combinação inovadora de diferentes abordagens para estimar a importância de uma palavra chave e o grau da relação semântica entre candidatos a palavras chave. O novo método incorporou ainda técnicas utilizadas para estimar o grau de autocorrelação espacial no uso de palavras chave, tendo como objectivo a captura da palavras chave candidata com padrões de distribuição espacial interessantes (por exemplo, palavras chaves específicas de uma dada região). Testamos os novos métodos em três corpora diferentes frequentemente usados para avaliar os métodos de extracção de palavras chave. Os resultados da avaliação indicam que os resultados obtidos com o novo método aproximam e, em alguns casos, superam os resultados obtidos por outros métodos estado-da-arte para extracção de palavras chave.
Extracção de palavras chaves, Medidas de centralidade, Modelos linguísticos, I de Moran, Heurísticas e extração de palavras chaves, Embeddings de palavras

Outubro 31, 2017, 16:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Miguel Daiyen Carvalho Won

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Prof Auxiliar Convidado