Dissertação

{pt=Porque sorri a Mona Lisa?} {} EVALUATED

{pt=O objectivo deste trabalho é a construção de uma plataforma ? denominada Art.Ask ? capaz de responder a perguntas em língua natural sobre arte. Em termos mais específicos este trabalho tem como objectivos: propor a arquitectura para esta plataforma; instanciar essa arquitectura com dois casos de estudo no domínio das artes: pinturas e dados biográficos relativos a artistas. Deste modo foi desenvolvido o Art.Ask, uma plataforma que engloba um módulo de extracção de informação e uma interface em língua natural, em Português, para o domínio das obras de arte. Neste trabalho, o sistema responde a perguntas sobre pinturas (autor, material, onde se encontra, etc.), bem como sobre dados biográficos de pintores (data nascimento, data morte, etc.). A arquitectura da aplicação baseia-se em quatro etapas: extracção de informação, reconhecimento de entidades mencionadas, interpretação da questão e acesso à base de dados. Inicialmente o sistema extrai informação da Wikipédia, faz o reconhecimento de entidades mencionadas (recorrendo a várias técnicas que são alvo de comparação nesta tese) e guarda-as numa base de dados. A interpretação da questão é igualmente realizada recorrendo a várias técnicas que comparam a pergunta dada pelo utilizador com perguntas pré-definidas. Com base na pergunta mais parecida, é calculada uma query SQL que acede à base de dados e devolve a resposta ao utilizador. Para além da avaliação de cada uma das etapas anteriores, o sistema foi avaliado globalmente, no domínio das perguntas sobre pinturas e pintores. 62% das respostas foram respondidas correctamente, 6% incorrectamente e 32% não foram respondidas., en=The aim of this work was to build a platform ? called Art.Ask ? that is able to answer questions asked in natural language about art. We set out to create an architecture for this platform and exemplify the architecture with two case studies about art: paintings and biographical details about the artists. The Art.Ask platform that was created includes an information extraction module and a natural language interface in Portuguese for the art world. The system answers questions about paintings (painter, material, current location, etc) and about the painters themselves (date of birth and death, etc). The programme architecture is based on four steps: data extraction, recognition of named entity, question interpretation and database access. Initially, the system extracts information from Wikipedia, recognizes named entity (relying on a series of techniques that will be compared in this thesis) and stored in a database. The question interpretation also employs various techniques that compare the user?s question with pre-defined ones. The most similar question is chosen and an SQL query is calculated that accesses the database and returns the answer to the user. Apart from assessing each of the above steps individually, the system was also subjected to an overall assessment using questions about paintings and painters and the results showed that 62% of the questions were answered correctly, 6% incorrectly and 32% were not answered.}
{pt=Compreensão de língua natural, museu, obras de arte, base de conhecimento, sistema de aprendizagem, entidades mencionadas, dicionários., en=Natural language understanding, museum, art, knowledgebase, machine learning, named entity, dictionary.}

Novembro 12, 2009, 13:30

Orientação

CO-ORIENTADOR

João Paulo da Silva Neto

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar

ORIENTADOR

Maria Luísa Torres Ribeiro Marques da Silva Coheur

Departamento de Engenharia Informática (DEI)

Professor Auxiliar