Dissertação
Identificar, Ordenar e Relacionar Eventos EVALUATED
As operações de extração de informação e análise de texto destacam-se nas tarefas de Processamento de Língua Natural (PLN) e são essenciais para o desenvolvimento e melhoria de sistemas capazes de, entre outras aplicações, realizar sumarizações e traduções de texto sem a intervenção humana. O trabalho descrito neste trabalho foca-se na identificação, relação e ordenação temporal de eventos, e contribuiu para o desenvolvimento da cadeia de processamento STRING (Statistical and Rule-Based Natural Language Processing), desenvolvido pelo Laboratório de Sistemas de Língua Falada (L$^2$F) do Instituto de Engenharia de Sistemas e Computadores - Investigação e Desenvolvimento em Lisboa (INESC-ID). Este documento contém um estudo de diversos sistemas de ordenação de eventos já existentes e dos verbos, nomes predicativos, conectores discursivos e advérbios de tempo no português, analisando a influência das conjunções, das preposições e dos advérbios na ordenaçao de eventos. Estendeu-se a STRING de modo a identificar mais eventos e foi desenvolvido e integrado um módulo responsável por detectar relações entre os eventos e ordená-los em relação com a linha do tempo. A tarefa de ordenação de eventos subdividiu-se em 4 fases: identificação de eventos; relações temporais; relações entre eventos; ordenação dos eventos. A identificação das relações é feita com base na informação já extraída pela STRING e no estudo efetuado em torno dos eventos e dos conectores discursivos no português. A partir das relações extraídas, dos eventos e das expressões temporais associadas aos eventos, o módulo extrai a ordem expressa entre os eventos.
novembro 12, 2014, 10:30
Publicação
Obra sujeita a Direitos de Autor