Dissertação

{pt_PT=Identificação e Classificação de Entidades Mencionadas e Eventos em Documentos da Marinha} {} EVALUATED

{pt=A informação de uma organização consiste maioritariamente em informação não estruturada. De forma a transformá-la em informação útil, foram desenvolvidas técnicas e ferramentas para a Extração de Informação (EI). Uma das tarefas da EI é o Reconhecimento e Classificação de Entidades Mencionadas (RCEM). O conceito de entidade mencionada foi inicialmente proposto pela Conferência MUC-6, em 1996. Desde então, múltiplas técnicas foram desenvolvidas para extrair entidades de diversos tipos de textos e para várias línguas. Mesmo assim, na comunidade de investigadores, o interesse para desenvolver novas abordagens para identificar e classificar entidades mencionadas mantêm-se, visto que esta operação permite extrair conhecimento do texto. Neste projeto, realizamos o tratamento dos documentos da Marinha Portuguesa, de forma a produzir um Corpus. Usando o Corpus, também, testamos a tarefa de RCEM da nossa cadeia de processamento de Língua Natural., en=An organization's information consists mostly of unstructured information. To transform it into useful information, techniques and tools for Information Extraction (IE) were developed. One of IE's tasks is Named-Entity Recognition and Classification (NERC). The named-entity concept was initially proposed by the MUC-6 Conference in 1996. Since then, multiple techniques have been developed to extract entities from different types of texts and for several languages. Even so, in the community of researchers, the interest to develop new approaches to identify and classify mentioned entities remains, since this operation allows to extract knowledge from the text. In this project, we carry out the treatment of Portuguese Navy documents, to produce a Corpus. Using Corpus, we also tested the NERC task of our Natural Language Processing chain.}
{pt=Processamento de Língua Natural (PLN), Reconhecimento EM (REM), en=Natural Language Processing (NLP), NE Recognition (NER)}

julho 27, 2020, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Jorge Manuel Evangelista Baptista

Universidade do Algarve

Professor Associado