Dissertação

{pt=Em que filmes participou a actriz Scarlett Johansson?} {} EVALUATED

{pt=O sistema JaTeDigo é uma interface em língua natural, para uma base de dados aplicada ao domínio do cinema com interacção escrita em Português. Os dados contidos na base de dados provêm da IMDB - Internet Movie DataBase, Website da Academia dos Óscares e do Website Cinema PTGate, perfazendo um total de cerca de meio milhão de nomes de pessoas e cerca de 600 mil títulos de filmes. O objectivo deste trabalho é o de efectuar melhoramentos no sistema JaTeDigo para que este consiga responder acertadamente a um maior número de questões colocadas pelos utilizadores. A primeira iteração centrou-se na implementação de um sistema de correcção ortográfica, módulo que não existia anteriormente no sistema JaTeDigo. A integração deste módulo trouxe um aumento de 8% no número de questões respondidas acertadamente. A segunda iteração passou pela substituição do módulo de interpretação de questões colocadas pelos utilizadores. Numa primeira fase a substituição foi feita ao nível da detecção de entidades mencionadas trazendo a nova abordagem, baseada na utilização de dicionário, um aumento de 13% no número de questões respondidas acertadamente. Numa segunda fase incidiu-se no método de interpretação do tipo de questão colocada pelos utilizadores, recorrendo-se à implementação do método Voting Model trazendo esta fase 22% de melhoramentos. , en=The JaTeDigo system is a natural language interface for a cinema database developed in Portuguese. The data for the database was gathered from: IMDB - Internet Movie DataBase, the Oscars Academy Website and the Cinema PTGate website, making a total of half a million names of people and six hundred thousand movie titles. The objective of this thesis it is to make improvements in the JaTeDigo system in order to make it able to correctly answer a larger number of questions posed by users. The first iteration focused on the implementation of a spell checking system, a module that previously did not exist in the JaTeDigo system. The integration of this module brings an increase of 8% in the number of correctly answered questions. The second iteration focused on the replacement of the question interpretation module. In a first phase, a replacement at the named entity recognition level took place, this new approach, based on dictionaries, brought an increase of 13% in the number of correctly answered questions. The second phase, focused on the question type interpretation, and was based on a Voting Model method implementation, bringing an increase of 22%. }
{pt=Língua Natural, Interpretação da Questão, Cinema, Entidades Mencionadas, Voting Model, Correcção Ortográfica, en=Natural Language, Question Interpretation, Cinema, Named Entity Recognition, Voting Model, Spell Check}

novembro 12, 2009, 14:45

Orientação

CO-ORIENTADOR

João Paulo da Silva Neto

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar