Dissertação
Neural Retrieval Models for Matching Patients to Clinical Trials EVALUATED
O recrutamento de participantes para ensaios clínicos é um processo bastante crítico, por isso é importante definir estratégias para melhorar estes processos. Uma alternativa para ajudar a mitigar este problema está em usar dados de pacientes juntamente com técnicas de recuperação de informação para encontrar pacientes adequados a ensaios clínicos. Este estudo pretende experimentar diferentes técnicas de recuperação de informação para fazer corresponder descrições de pacientes a ensaios clínicos utilizando para isso dados da tarefa TREC 2021 Clinical Trials. Estes métodos recebem como entrada um conjunto de informações dos pacientes e produzem uma lista ordenada com os ensaios clínicos mais relevantes através de técnicas baseadas em representações densas e esparsas. Para os métodos com representações densas foram usados modelos Sentence Transformers, de arquitetura bi-codificador, treinados para pesquisa semântica num conjunto de dados grande e diversificado. Foram ainda exploradas técnicas de transferência de aprendizado com o objetivo de melhorar os resultados do ranking através da adaptação do modelo ao domínio clínico. Foram ainda testadas técnicas de amostragem negativa aleatória. No geral, as experiências com métodos de recuperação com representações densas obtiveram melhores resultados quando comparadas com as experiências feitas com técnicas com representações esparsas. Fazendo recuperação com modelos treinados em pequenos conjuntos de dados relacionados ao domínio do estudo mostrou ser o método mais eficaz. A melhor estratégia consistiu em treinar o modelo com os dados SIGIR-CT, seguido do treino com os dados TREC-PM.
novembro 28, 2022, 9:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
AUTOR
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Electrotécnica e de Computadores (DEEC)
Professor Associado