Dissertação

{en_GB=Processing Frozen Sentences in Portuguese: Automatic Rule and Example Generation from a Lexicon-Grammar} {} EVALUATED

{pt=Expressões fixas são expressões multi-palavra que constituem um grande conjunto da léxico-gramática de muitas línguas, embora a sua frequência em textos seja, muitas vezes, baixa. Analisar expressões fixas é uma tarefa desafiante porque estas são conjuntos de palavras sintaticamente analisáveis, mas cujo significado é não-composicional. dado um sistema de Processamento de Língua Natural para Português Europeu, o principal objetivo deste projeto é usar a matriz que contém a mais recente descrição linguística de forma a conseguir traduzi-la para regras Xerox Incremental Parser (XIP), permitindo ao sistema não só identificar as frases manualmente produzidas que podem ser encontradas na matriz, mas também as automaticamente geradas a partir destas, através da aplicação das transformações permitidas por cada construção. De forma a atingir esse objetivo, o gerador de regras foi reconstruído de tal forma que as regras geradas incluam não apenas a estrutura básica do idioma mas também as várias transformações ou redução de certos elementos a pronomes que podem ser aplicados a cada frase. Um módulo que gera automaticamente este tipo de frases a partir das frases base foi também desenvolvido. Também foi implementada validação automática de forma a verificar o desempenho do sistema, que foi globalmente melhorado quando comparado com o sistema anterior, permitindo uma identificação mais correta e abrangente de expressões fixas. , en=Frozen sentences are multi-word expressions that constitute a large set of the Lexicon-Grammar of many languages, though their frequency in texts is often very low. Parsing frozen sentences is a challenging task because they are syntactically analyzable strings whose meaning is non-compositional. Given an existing Natural Language Processing (NLP) system for European Portuguese, the main goal of this project is to use the matrix containing the most recent linguistic description in order to be able to correctly translate it to XIP rules, allowing for it to identify not only manually produced sentences, but also automatically generated ones from the base sentences by applying the transformations authorised by each construction. In order to achieve that goal, the rule generator was rebuilt so that the generated rules include not only the basic structure of the idiom, but also the several transformations or reduction of certain elements to pronouns that may be applied to each sentence. A module that automatically generates this type of sentences from the base sentences was also developed. Automatic validation was also implemented in order to verify the performance of the system, which was overall improved when compared to the previously existent system, allowing for a more correct and inclusive identification of frozen expressions.}
{pt=Processamento de Língua Natural, Expressões Fixas, Idiomas verbais, Expressões multipalavra, Categoria gramatical, en=Natural Language Processing, Frozen Sentences, Verbal Idioms, Parsing Multiword Expressions, Part of Speech}

Junho 5, 2019, 10:30

Orientação

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Jorge Manuel Evangelista

Universidade do Algarve

Professor Associado