Dissertação

JáTeDigo - Uma interface em língua natural para uma base de dados de cinema EVALUATED

As interfaces em língua natural para bases de dados já são desenvolvidas desde os anos 60 e têm como principais vantagens a expressividade, fácil utilização e capacidade de incorporar figuras de estilo tais como anáfora e elipse. O JáTeDigo é uma interface em língua natural, em Português, para uma base de dados aplicada ao domínio de cinema. Os dados recolhidos provêm de diferentes fontes, tendo sido principalmente obtidos através do IMDB - Internet Movie Database. A arquitectura da aplicação baseia-se em quatro etapas principais: reconhecimento de entidades mencionadas, desambiguação, processamento de língua natural e, finalmente, acesso à base de dados. Na primeira fase são reconhecidos os títulos de filmes e nomes de pessoas que estão presentes na questão. Seguidamente, caso haja em base de dados mais que uma entidade com o mesmo nome (filmes com o mesmo título, pessoas com o mesmo nome), solicita-se a sua desambiguação. Concluídas as duas anteriores fases, a questão é submetida à cadeia de processamento de língua natural. Se a questão emparelhar com um dos padrões sintácticos definidos nessa cadeia, é escolhido o script adequado para obter a resposta à questão através do acesso à base de dados. Para determinar a eficácia da aplicação foi concebida uma interface Web e foram realizados vários testes com diversos utilizadores.
Língua Natural, Interpretação, Cinema, Ambiguidade, Interface, Informação

novembro 5, 2007, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar