Dissertação

{pt_PT=Legibilidade de Livros de Ensino de Português} {} EVALUATED

{pt=Estudos demonstram que os alunos portugueses, comparando com outros países da OCDE, apresentam taxas de literacia de leitura abaixo da média. Este fato pode ser problemático, já que a capacidade de leitura desempenha um papel central, não apenas no desempenho acadêmico, mas também no sucesso profissional do aluno. Partindo do pressuposto de que esta habilidade é adquirida ao longo da vida escolar, seria interessante verificar se uma possível razão para esta baixa capacidade de leitura estaria nos próprios livros didáticos, mais concretamente, na ausência de correspondência entre a dificuldade e o ano de escolaridade para o qual foram editados. O objetivo principal deste projeto foi classificar um conjunto de textos, pertencentes a um corpus de manuais escolares de português, de acordo com seu grau de dificuldade, utilizando um conjunto de parâmetros linguísticos. Desta forma, desenvolveu-se um sistema com a capacidade de avaliar a inteligibilidade de um texto. Na primeira fase, foi realizado um estudo para avaliar as abordagens e ferramentas já utilizadas neste contexto. Posteriormente, foi desenvolvido um sistema de processamento de linguagem natural, capaz de extrair um conjunto de parâmetros linguísticos, representativos da dificuldade de um determinado texto. Quatro classificadores foram desenvolvidos, treinados com os parâmetros extraídos e diferentes combinações de escalas no corpus de manuais escolares. O melhor classificador, na escala de 8 níveis (5º ao 12º ano), obteve uma precisão de 29,16%, enquanto na escala simplificada de 3 níveis (2º e 3º Ciclos e Ensino Secundário), alcançou uma precisão de 59,37%. , en=Studies show that Portuguese students, compared to the other OCDE countries, have below-average reading literacy rates. This can be problematic since the ability to read plays a pivotal role not only in the student's academic performance but also in his professional success. Based on the assumption that reading, comprehension and interpretation skills are acquired throughout school life, it would be interesting to verify if a possible reason for this low literacy rate could be found in the textbooks themselves, more concretely, in the absence of correspondence between the year of schooling and the level of difficulty of the texts of the corresponding textbooks. The main objective of this project was to classify a set of texts, belonging to a corpus of Portuguese textbooks, according to their degree of difficulty using a set of linguistic parameters. In this way, we developed a system with the ability to evaluate the readability of a text. In the first phase, a study was done to evaluate the approaches and tools that are used in this context. Subsequently, a natural language processing system was developed, able to extract a set of linguistic parameters, representative of the difficulty of a given text. Four different classifiers were developed, trained with the parameters and different combinations of scales in the corpus of school textbooks. The best classifier, on the 8-level scale (grades 5-12), obtained an accuracy of 29.16%, while for the simplified scale of 3-levels (2nd and 3rd Cycles and High School), it reached an accuracy of 59.37%. }
{pt=Inteligibilidade, Métricas de inteligibilidade, Classificador de inteligibilidade, en=Readability, Readability Metrics, Automatic Redability Classifier}

novembro 6, 2018, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Nuno João Neves Mamede

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Jorge Manuel Evangelista Baptista

Universidade do Algarve

Professor Associado