Dissertação

LexMan: um Segmentador e Analisador Morfológico com Transdutores EVALUATED

Na arquitetura inicial da cadeia de Processamento de Língua Natural (PLN) do L2F, STRING, a segmentação e a análise morfológica eram realizadas por 2 módulos distintos: a segmentação era feita através de expressões regulares enquanto a análise morfológica usava um transdutor para atribuir as etiquetas morfossintáticas aos segmentos. Este trabalho permitiu, usando transdutores, juntar a segmentação e a análise morfológica num único módulo, o LexMan. Esta mudança possibilitou a transferência das regras de junção de segmentos independentes de contexto, que estavam implementadas no módulo de desambiguação morfossintático da cadeia, o RuDriCo, para o módulo LexMan. A informação usada na geração do transdutor do dicionário foi ainda complementada com informação derivacional, tendo passado a ser possível também o reconhecimento de palavras derivadas por prefixação. Foram concebidas, construídas e avaliadas duas arquiteturas distintas, comparando-as com a arquitetura inicial, tendo-se concluído que as novas soluções eram mais eficientes no processamento de textos de grandes dimensões. Considerando os textos de maiores dimensões avaliados, a arquitetura baseada na operação Prune foi 8.63% mais rápida do que a baseada na operação ShortestPath, e 69.6% mais rápida do que a arquitetura inicial. A melhor solução complementa o transdutor do dicionário com informação derivacional sobre prefixos, permitindo aumentar a cobertura das palavras identificadas e etiquetadas pelo LexMan. A integração deste módulo originou, no processamento dos mesmos textos, uma perda da velocidade de desempenho de 15.56%. Essa perda foi atenuada após terem sido removidas as palavras prefixadas, entretanto tornadas redundantes, do dicionário de lemas.
Processamento de Língua Natural, Transdutores, Segmentação, Análise Morfológica

Junho 5, 2013, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Jorge Manuel Evangelista Baptista

Universidade do Algarve, Faculdade de Ciências Humanas e Sociais

Professor Associado

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado