Dissertação
DISSERTATION: Extracção de Informação Biológica em Artigos Científicos EVALUATED
Ao longo dos anos, muitos trabalhos científicos têm sido publicados na área da Biologia a fim de compreender e antecipar os efeitos das mudanças globais que contribuem para a redução drástica da biodiversidade na Terra. Contudo, existe uma enorme dispersão do conhecimento e torna-se difícil o estudo aprofundado de cada espécie pois a informação é normalmente disseminada por muitos artigos diferentes. Com a evolução das tecnologias, técnicas de Text Mining têm sido desenvolvidas e utilizadas a fim de extrair automaticamente dados relevantes a partir de textos, imagens e gráficos. Neste trabalho o objectivo principal é extrair informação sobre aves, presente em artigos científicos tentando responder à questão, “Será possível construir um sistema que possa extrair automaticamente dados de determinadas espécies de aves a partir de artigos científicos?”. Para desenvolver a nossa solução criámos um sistema que procede à análise do texto através da combinação de técnicas de Processamento de Língua Natural, Expressões Regulares e algoritmos de Aprendizagem Automática. O sistema recebe, como entrada, o conjunto de artigos a analisar e, como resultado, apresenta os possíveis valores para as características da espécie que queremos observar (temperatura corporal, massa corporal, entre outros). Como principal conclusão deste trabalho, demonstrámos que é possível construir um sistema para a extracção de dados a partir de artigos científicos no domínio da Biologia. Contudo, ainda não é possível ter um sistema completamente automático tornando-se relevante um utilizador humano que possa resolver ambiguidades nos resultados.
novembro 14, 2016, 14:30
Publicação
Obra sujeita a Direitos de Autor