Dissertação

{en_GB=Binary Aggregation for Book Retrieval} {} EVALUATED

{pt=Com o constante crescimento do volume de colecções de documentos, surgem novos desafios para armazenar, organizar e recuperar as informações necessárias de forma eficiente. Ao lidar com um espaço de características com elevadas dimensões, os vetores tornam-se extremamente esparsos (a maioria das dimensões são zero). Métodos existentes lutam para lidar com a queda de eficiência subjacente. A maioria deles carece nas ferramentas utilizadas acabando por utilizar outras abordagens como a selecção de características ou a realização de procuras aproximadas por vizinhos mais próximos. Neste trabalho, sugere-se um novo método de indexação que permite realizar uma procura por similaridade exata. Motivados pelos resultados dos trabalhos "Content-based image retrieval by hierarchical linear subspace method" (Wichert, 2008) e "Tree-like hierarchical associative memory structures" (Sacramento e Wichert, 2011), sugere-se a utilização de uma organização hierárquica, onde os vectores esparsos são sucessivamente uma redução um do outro (utilizando o operador lógico OR aplicado ao paradigma da janela deslizante). Desta forma, utilizando um procedimento de aprofundamento progressivo somos capazes de melhorar o desempenho da recuperação por similaridade em ambientes de elevadas dimensões., en=With the ever-increasing volumes of data, it is becoming more challenging to store, organize and retrieve the required information in an efficient manner. When dealing with high dimensional feature space, vectors become extremely sparse (most dimensions are zero). The existing representation models struggle to deal with the drop of efficiency. The majority of them lack the tools turning to use either feature selection or Approximate Nearest Neighbour searches. The work herein proposed introduces a new indexing method which enables exact similarity searches. Motivated by the results of the works "Content-based image retrieval by hierarchical linear subspace method" (Wichert, 2008) and "Tree-like hierarchical associative memory structures" (Sacramento e Wichert, 2011), we suggest the use of a hierarchical organization where sparse vectors are successively a reduction of one another. Thus, with a progressively deeper procedure, we aim to enhance the retrieval performance in comparison to baseline methods.}
{pt=Bases de dados de texto, Vetores esparsos, Indexação em elevadas dimensões, Agregação OR, Representação estrutura hierárquica, en=Text Databases, Sparse Vectors, High-Dimensional Indexing, OR-Aggregation, Hierarchical Structure Representation}

Novembro 5, 2015, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Andreas Miroslaus Wichert

Departamento de Engenharia Informática (DEI)

Professor Auxiliar