Dissertação

Exact High-Dimensional Indexing EVALUATED

Nos últimos anos, as bases de dados passaram a ser capazes de armazenar cada vez mais dados. Actualmente é possívelguardar um grande volume de informação, o que torna necessário existir técnicas para ser possível gerir e aceder à informação eficientemente. Uma das existentes áreas de investigação, tenta desenvolver novas estratégias para procuras baseadas em contúdo de objectos multimédia semelhantes. A ideia é realizar procuras numa base de dados e obter o(s) elemento(s) mais semelhantes em relação a um dado objecto multimédia que serve como referência. Este tipo de operação é conhecido como Nearest-Neighbor Search (NN). Contudo, quando se passa a lidar com objectos de alta dimensão, o processo de procura torna-se uma operação não-trivial. Isto deve-se ao facto de que quando se aumenta a dimensão dos dados, efeitos conhecidos como “curse of dimensionality” começam a ocorrer, tendo como consequência uma quebra exponencial na performance. A maior parte dos métodos de indexação não consegue fazer face a este problema, pelo que recorrema métodos de procura do tipo Approximate-Nearest Neighbor (ANN) ou então reduzem o número de features dos objectos multimédia. Contudo, existe um método que consegue lidar com o problema da “curse of dimensionality”. O Hierarchical Linear Subspace Method (HLSM) pode ser usado em base de dados de alta dimensionalidade e permite procuras do tipo Nearest-Neighbour (NN). Neste trabalho são apresentados vários métodos de indexação e é proposta uma variação ao método HLSM. São realizadas várias experiências para validar o método proposto e os resultados são analizados e discutidos.
Indexação de Alta Dimensionalidade, HLSM, PCA

Junho 6, 2013, 14:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Andreas Miroslaus Wichert

Departamento de Engenharia Informática (DEI)

Professor Auxiliar