FenixEdu™

Dissertação

{en_GB=Relevance ranking for Web Search } {} EVALUATED

Detalhes: {pt=Ordenar documentos de acordo com a sua relevância é um problema fulcral na área de Recuperação de Informação. Para uma certa query e um conjunto de documentos, um algoritmo é treinado para determinar o grau de relevância de cada documento em relação à query. Uma lista é depois construída com os documentos todos ordenados por ordem descendente, consuante os seus graus de relevância. Recentemente, modelos neurais têm conseguido bons resultados ao capturarem com sucesso sinais de relevância entre um par query-documento. Esta dissertação estuda o recente modelo Position-Aware Convolutional-Recurrent Relevance Matching. Numa primeira fase, o modelo é reimplementado, os resultados são reproduzidos e são identificadas várias limitações do modelo. Numa segunda fase, são explorados possíveis melhoramentos do modelo, utilizando algumas técnicas de deep learning. Experiências usando data do conhecido TREC Web Track mostram como é possível obter pequenos ganhos em relação ao modelo original, e apontam para várias limitações da abordagem ao problema. , en=Relevance ranking is a core problem of Information Retrieval which plays a fundamental role in various real world applications, such as search engines. Given a query and a set of candidate documents, relevance ranking algorithms determine how relevant each document is for the given query. This degree of relevance allows them to rank the documents and perform actions such as returning the best matching documents for the query. As in other machine learning disciplines, deep learning techniques have recently achieved state of the art results by successfully capturing relevance matching signals between query-document pairs. This dissertation focuses on the recently introduced Position-Aware Convolutional-Recurrent Relevance Matching approach. On a first phase, it reimplements the original work, reproduces the published results and performs a number of additional experiments that identify potential model limitations. On a second phase, it explores possible model improvements based on deep learning techniques such as self-attention and deep transfer learning. Experiments on the well known TREC Web Track data show that it is possible to obtain small improvements over the original model and point to a number of limitations of the general approach due to the information bottlenecks involved.}
Keywords: {pt=Recuperação de Informação, Ordenação por Relevância, Deep Learning, Attention Mechanisms, Rede Neural Convolucional, en=Information Retrieval, Relevance Ranking, Deep Learning, Attention Mechanisms, Convolutional Neural Networks}

Discussão: maio 16, 2018, 11:0