Dissertação

Machine Learning Methods for Resolving Temporal References in Text EVALUATED

As expressões temporais, usadas para nos elucidar das mudanças no mundo, são cruciais em várias aplicações de processamento de lingua natural, tais como, sistemas de pergunta-resposta, sumarização de texto, sistemas de extracção de informação temporal, etc. Nesta tese é apresentado um método de aprendizagem automática para a resolução de expressões temporais, isto é, ligar sequências de caracteres nos documentos aos correspondentes intervalos e instancias de tempo. Esta é uma tarefa fundamental na extracção de informação temporal, suportando o acesso a grandes quantidades de documentos através do tempo. O método proposto é uma instancia da chamada aprendizagem em pilha, na qual um primeiro modelo de aprendizagem baseado em Conditional Random Fields é usado para etiquetar referencias temporais no texto e um segundo modelo de aprendizagem baseado em regressão por SVM é usado para classificar e escolher entre um conjunto de desambiguações possível para a referencia temporal inicialmente etiquetada. O método proposto foi avaliado usando um conjunto de dados em Inglês contendo anotações TIMEX2 e TimeML para as referências temporais. Os melhores resultados, em termos de medida F1, que o método proposto alcançou foram 0.93 e 0.67 para as tarefas de reconhecimento e desambiguação respectivamente, o que mostra que esta abordagem se compara bem contra abordagens propostas anteriormente.
Expressões Temporais, Aprendizagem Automática, Extracção de Informação

novembro 7, 2011, 19:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

CO-ORIENTADOR

Pável Pereira Calado

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar