Dissertação

Neural Methods for Biomedical Synonym Discovery and Concept Alignment EVALUATED

No domínio biomédico, a identificação de conceitos sinónimos é altamente desafiante devido à heterogeneidade de vocabulário, às variações lexicais, e à cobertura não uniforme de terminologias médicas padronizadas. Este trabalho aborda este desafio em particular, argumentando que o alinhamento de conceitos pode ser feito através da semelhança aproximada de strings utilizando redes neuronais. Em particular, foram aproveitados estudos recentes que avaliaram métodos de correspondência de strings em áreas não biomédicas como, por exemplo, a utilização de redes neuronais recorrentes bidireccionais ou modelos \textit{Transformer} para codificar e combinar pares de conceitos. Em particular, foram treinados modelos com dados biomédicos recolhidos da Wikidata, e testados em 15 conjuntos de dados (datasets) construídos a partir de diferentes ontologias biomédicas, representando domínios específicos. Os nossos testes avaliaram aspetos tais como a influência de codificações posicionais enquanto input destas redes, o tamanho do dataset de treino, e a contribuição do ajuste fino do modelo (fine-tuning) com dados específicos de cada domínio. Os resultados experimentais mostram que as redes neuronais tiveram um desempenho consistentemente melhor do que as abordagens tradicionais de semelhança de strings, particularmente com maiores quantidades de dados de treino. Na maioria dos testes, os modelos baseados no modelo Transformer também tiveram melhor desempenho do que os modelos baseados em redes neuronais recorrentes.
Alinhamento de conceitos biomédicos, Correspondência de strings, Aprendizagem supervisionada, Redes Neuronis Recorrentes, Modelos Transformer

novembro 25, 2021, 10:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado

ORIENTADOR

Daniel Pedro de Jesus Faria

LASIGE, FCiências.ID, Universidade de Lisboa

Doutor