Dissertação

Classificador de textos para o ensino de português como segunda língua EVALUATED

A seleção de materiais de leitura para fins pedagógicos é uma tarefa importante para o ensino de línguas e que, no caso do ensino da língua portuguesa, ainda é maioritariamente realizada manualmente. Nesta dissertação, desenvolveu-se um sistema de extração de características linguísticas e um conjunto de classificadores automáticos para auxílio ao ensino de Português como segunda língua, que consistiu em: (i) estudo de diferentes abordagens para o cálculo da inteligibilidade dos textos e a apresentação de sistemas relacionados; (ii) análise da dificuldade da tarefa de classificação de textos quanto ao seu nível de inteligibilidade; (iii) desenvolvimento de um sistema de extração de características linguísticas a partir de textos para a sua classificação, recorrendo a ferramentas de Processamento de Língua Natural, nomeadamente STRING (Statistical and Ruled-based Natural lanGuage processing chain) e o YAH (Yet Another Hyphenator); este sistema extrai 52 características organizadas em cinco tipos de informação (categorias morfossintáticas, sintagmas e métricas relativas a frases; métricas relativas a palavras; métricas relacionadas com verbos e diferentes métricas que envolvem médias e frequências; diversas métricas que envolvem sílabas; e métricas adicionais); (iv) construção de seis classificadores com caraterísticas distintas, resultantes de diferentes combinações do tipo de corpus utilizado para os treinar e da granularidade da escala de inteligibilidade a aplicar; o melhor classificador, na escala de 5 níveis (A1 a C1), obteve uma exatidão de 75%, e, na escala de 3 níveis (A, B e C), 81%; (v) desenvolvimento de uma interface web, disponibilizando os sistemas a um público alargado.
Inteligibilidade, Métricas de avaliação de inteligibilidade, Classificador automático, Extração de características linguísticas, Português europeu

Novembro 5, 2014, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Jorge Manuel Evangelista Baptista (Fchs - Universidade do Algarve)

FCHS - Universidade do Algarve

Professor Associado

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado