Dissertação

Neural Retrieval Models for Matching Patients to Clinical Trials EVALUATED

O recrutamento de participantes para ensaios clínicos é um processo bastante crítico, por isso é importante definir estratégias para melhorar estes processos. Uma alternativa para ajudar a mitigar este problema está em usar dados de pacientes juntamente com técnicas de recuperação de informação para encontrar pacientes adequados a ensaios clínicos. Este estudo pretende experimentar diferentes técnicas de recuperação de informação para fazer corresponder descrições de pacientes a ensaios clínicos utilizando para isso dados da tarefa TREC 2021 Clinical Trials. Estes métodos recebem como entrada um conjunto de informações dos pacientes e produzem uma lista ordenada com os ensaios clínicos mais relevantes através de técnicas baseadas em representações densas e esparsas. Para os métodos com representações densas foram usados modelos Sentence Transformers, de arquitetura bi-codificador, treinados para pesquisa semântica num conjunto de dados grande e diversificado. Foram ainda exploradas técnicas de transferência de aprendizado com o objetivo de melhorar os resultados do ranking através da adaptação do modelo ao domínio clínico. Foram ainda testadas técnicas de amostragem negativa aleatória. No geral, as experiências com métodos de recuperação com representações densas obtiveram melhores resultados quando comparadas com as experiências feitas com técnicas com representações esparsas. Fazendo recuperação com modelos treinados em pequenos conjuntos de dados relacionados ao domínio do estudo mostrou ser o método mais eficaz. A melhor estratégia consistiu em treinar o modelo com os dados SIGIR-CT, seguido do treino com os dados TREC-PM.
Recuperação da Informação, Bi-Codificadores, BERT

novembro 28, 2022, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado

ORIENTADOR

João Magalhães

Departamento de Informática, FCT-UNL

Professor Associado