Dissertação

{pt=Identificação Automática de Nomes Compostos} {} EVALUATED

{pt=Esta tese centra-se na identificação de nomes compostos na língua portuguesa. Nomes compostos são sequências de palavras cujo significado não pode ser extraído através da composição do significado literal das palavras, mas sim o seu significado figurativo quando certas palavras se encontram juntas. Esta tarefa pertence à área de processamento de língua natural (PLN) e é útil em sistemas de tradução, sistemas Pergunta-Resposta, extracção de informação e sumarização automática. Este documento analisa e compara vários sistemas usados para a identificação de termos compostos, descreve os procedimentos adoptados para a identificação destes mesmos termos e descreve o procedimento a ser efectuado para avaliar os resultados obtidos., en=This thesis focuses on the identification of multiwords in the Portuguese language. Multiwords are sequences of words whose meaning can not be extracted through the composition of the literal meaning of its words, but its figurative meaning when certain words are together. This task belongs to the area of natural language processing (NLP) and is useful in machine translation systems, question-answer systems, information extraction and automatic summarization. This paper analyzes and compares various systems used for the identification of multiwords, describes the procedures adopted for the identification of these multiwords and describes the procedure to be performed to evaluate the results.}
{pt=Nome Composto, Métodos Estatísticos, Algoritmos, Critérios Sintácticos, Corpus, en=Multiword, Statistical Methods, Algorithms, Syntactic Criteria, Corpus}

Novembro 16, 2011, 8:0

Orientação

CO-ORIENTADOR

Jorge Manuel Evangelista Baptista

Faculdade de Ciências Humanas e Sociais - Universidade do Algarve

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado