Dissertação

Metadata Extraction from Scholarly Articles EVALUATED

Actualmente, as bibliotecas digitais que contêm material académico dependem bastante da disponibilidade dos seus metadados. Como tal, o desenvolvimento de mecanismos automáticos para a extracção de metadados de artigos com um cariz académico tem sido área de elevada importância. Neste âmbito, o trabalho apresentado neste documento pretende abordar este problema utilizando métodos de aprendizagem automática. Nesta dissertação são apresentados os conceitos mais importantes, trabalhos prévios relevantes e são descritos os sistemas que foram criados para a resolução desta tarefa. Neste documento são descritas experiências com um sistema para extracção de metadados que recorre aos modelos Conditional Random Fields com uma arquitectura baseada em composição. As experiências realizadas comprovam que a composição deste tipo de modelos pode ser uma abordagem valiosa para o problema de extracção de metadados a partir de artigos com um cariz acádémico.
Bibliotecas Digitais, Conditional Random Fields, Extracção de Metadados, PDF, Artigos Científicos, Engenharia de Features, Composição de Modelos

Novembro 17, 2011, 16:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Pável Pereira Calado

Departamento de Engenharia Informática (DEI)

Professor Auxiliar