Dissertação
Detecting and Characterizing User Sessions in the Context of a Search Engine for Legislative Contents EVALUATED
A segmentação das interações do utilizador conforme registradas nos registos de queries de um motor de busca, de acordo com as necessidades de informações subjacentes (por exemplo, delimitando as sessões do utilizador), é importante para perceber as necessidades de informação e avaliar como elas são satisfeitas, para melhorar a qualidade das funções de ranking e para melhor direcionar conteúdo para determinados utilizadores. A maioria dos métodos anteriores usa julgamentos humanos para informar algoritmos de aprendizagem supervisionada e/ou usam limites globais de proximidade temporal e métricas simples de similaridade lexical. Esta dissertação apresenta um método não supervisionado para segmentar sessões do utilizador que aprimora o atual estado da arte, aproveitando heurísticas adicionais e métricas de similaridade derivadas de word embeddings. Eu estendi uma abordagem anterior baseada na combinação de medidas de similaridade temporal e lexical, integrando componentes de similaridade semântica que usam FastText embeddings pré-treinados. Com base no método de segmentação de sessões, esta dissertação também avança uma abordagem não supervisionada para detectar missões detectando comportamento multitarefa e/ou objetivos hierárquicos. Eu reporto experiências com dois subconjuntos diferentes do conhecido dataset do AOL, ambos usados em estudos anteriores. Os resultados atestam a eficácia dos métodos propostos, que superam um grande conjunto de baselines, correspondendo também a técnicas não supervisionadas. Com base nos métodos anteriores, realizei um estudo de caracterização para inferir a satisfação do utilizador no contexto de um motor de busca de conteúdos legislativos.
dezembro 2, 2019, 16:30
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar