Dissertação

Desambiguação automática de pesquisas EVALUATED

O crescimento do volume de documentos disponíveis em fontes como a Internet e bibliotecas digitais tem levado ao aumento no interesse em métodos capazes de recuperar informação relevante de forma cada vez mais precisa. Técnicas de redução de dimensões, tais como Latent Semantic Indexing, têm provado ser capazes de aumentar a qualidade da informação recuperada ao capturar o significado semântico das palavras presentes nos documentos. No entanto, tais técnicas têm custos computacionais demasiado altos, o que as tornam proibitivas de aplicar a colecções de documentos de tamanhos reais. Neste trabalho avaliamos o potencial da utilização de clustering como forma de redução da dimensionalidade para capturar os conceitos presentes nos documentos e testamos a aplicabilidade e benefícios deste método num sistema de recuperação de informação.
Recuperação de Informação, procura semântica, clustering, modelos vectoriais, redução de dimensionalidade

novembro 10, 2010, 17:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Pável Pereira Calado

Departamento de Engenharia Informática (DEI)

Professor Auxiliar