Dissertação

{en_GB=Big data meets nature conservation: Automatic tools for information extraction} {} EVALUATED

{pt=Nos tempos que correm, a biodiversidade tem estado em declínio globalmente, e, por isso, a comunidade científica tem pensado e desenvolvendo modelos para compreender e parar esse mesmo declínio. Ao longo dos anos, o número de artigos científicos com dados recolhidos pelos cientistas tem vindo a aumentar e, devido à dispersão de informação, tornou-se impossível a recolha de informação acerca de um grupo taxonómico de alto nível, como o das aves. Neste trabalho apresentamos um sistema capaz de responder às seguintes questões: "Será possível construir uma ferramenta capaz de extrair informação disponível em artigos científicos e selecionar aquela que corresponde a certas características fisiológicas?'' e "Será possível tirar vantagem do conhecimento do utilizador para melhorar a eficácia dessa ferramenta?''. O sistema recebe artigos científicos, extrai dados, sobre características fisiológicas das espécies em estudo, desses artigos e classifica-os, usando expressões regulares e técnicas de aprendizagem automática., en=Biodiversity has been declining globally while the scientific community has been thinking and developing models to understand and stop this decline. Over the years, the number of scientific articles with data collected by scientists has been increasing and, due to the dispersion of information, it has become almost impossible to gather all the data of an high-level taxonomic group. In this work we present a system capable of answering the following questions: "Is it possible to build a tool capable of extracting the information available in scientific articles and selecting the one that may correspond to the selected physiological characteristics?'' and "Is it possible to take advantage of the user's knowledge to improve the effectiveness of this tool?''. The system receives as scientific articles, extracts data, about physiological characteristics of the species being studied, from those articles and classifies it, using regular expressions and machine learning techniques.}
{pt=Biologia, Aprendizagem Automática, Expressões Regulares, Extração de Informação, en=Biology, Machine Learning, Regular Expressions, Information Extraction}

Outubro 31, 2018, 13:0

Orientação

ORIENTADOR

Pável Pereira Calado

Departamento de Engenharia Informática (DEI)

Professor Associado

ORIENTADOR

Gonçalo José Monteiro Marques

Departamento de Engenharia Mecânica (DEM)

Colaborador Docente