Dissertação

PROLEGIS – Intelligent Search in Legislation Databases EVALUATED

A legislação portuguesa, semelhante a outros países, não é publicada de forma organizada em tópicos e conceitos, mas sim organizada por um sistema numerado por ordem e data da publicação. Para um cidadão comum ou mesmo investigadores, procurar informação relativamente a um tema ou problema específico é uma tarefa árdua e complexa. A categorização manual de texto legal, além de necessitar de profissionais especializados, é uma tarefa que requer bastante tempo devido ao elevado número de documentos existentes. Como tal, o objetivo deste trabalho centra-se em avaliar a possibilidade de automaticamente atribuir-se a estes documentos legislativos uma categoria utilizando-se algoritmos de Aprendizagem Automática. O foco deste trabalho será no domínio supervisionado, ainda assim, uma análise de agrupamento não supervisionado será realizada. Múltiplos algoritmos de classificação são também experimentados, utilizando documentos pré-classificados, para avaliar comparativamente os seus desempenhos na classificação. Support Vector Machines, K-Nearest Neighbours, Multinomial Naive Bayes e Decision-Trees são analisados individualmente e, para procurar melhorar os resultados, em conjunto com várias técnicas de pré processamento de características. Latent Semantic Indexing, seleção de características com diferentes métricas e stemização são analisados.
Legislação Portuguesa, Textos Legais, Categorização de Texto, Classificação

Maio 31, 2016, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Carlos Alberto Pinto Ferreira

Departamento de Engenharia Mecânica

Professor Aposentado

ORIENTADOR

Luís Manuel Marques Custódio

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar