Dissertação

Automatic Categorization of the IST’s Acquis Digital Images EVALUATED

O principal objetivo desta tese era automatizar o processo de classificação do conteúdo digital ou passível de ser digitalizado do nu ́cleo de arquivo do IST. Considerando as diversas possibilidades para tratar um problema de classificação deste tipo, esta tese foca-se numa abordagem multilabel. Nomeadamente, iremos estudar se as capsule networks podem ser usadas com sucesso para resolver este problema, uma vez que, segundo a literatura, já tiveram sucesso nesta área com conjuntos de dados textuais. Para este estudo consideraram-se e compararam- se os resultados obtidos por uma capsule network comum, uma capsule network com o uso de mecanismos de atenção e uma convolutional network baseada VGG16 network. Uma vez que o problema foi considerado como um problema multilabel e uma vez que o conjunto de dados não é balanceado, o desempenho de cada classificador tem que ser medido através de medi- das de desempenho apropriadas. Assim, usaram-se medidas como a precisão, recall, F1-score e accuracy por classe. No que diz respeito aos resultados, concluímos que, os mecanismos de atenção terem melhorado a performance das cápsulas em classes com menos exemplos. Ainda assim, as capsule network no conseguem igualar o classificador VGG16, que obteve uma precisão média de 81 % e 70 % relativamente à medida F1-score.
Aprendizagem Supervisionada, Classificação Multi-etiqueta, Classificação Hierárquica, Redes Neurais em Cápsulas, Mecanismos de Atenção

Janeiro 19, 2021, 15:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Francisco Miguel Alves Campos de Sousa Dionísio

Departamento de Matemática (DM)

Professor Auxiliar

ORIENTADOR

David Manuel Martins de Matos

Departamento de Engenharia Informática (DEI)

Professor Associado