Dissertação

{en_GB=Automatic Dating of Textual Documents} {} EVALUATED

{pt=Neste trabalho é abordada a atribuição automática de classes temporais a documentos textuais, ou seja, a tarefa de determinar a que período temporal determinado documento se refere, ou em que data o mesmo foi escrito. O método apresentado, baseado numa rede neuronal profunda, tem apenas em conta palavras ou pistas presentes no texto. A rede neuronal proposta visa a exploração da natureza hierárquica dos inputs considerados (i.e., os documentos são modelados como sequências de frases, que por sua vez são sequências de palavras), combinando embeddings pré-treinados, recurrent units e mecanismos de attention para gerar representações intermédias para os conteúdos textuais. De forma a validar o modelo apresentado, este trabalho apresenta também uma série de resultados experimentais com quatro datasets com diferentes características e que nos ajudam a cruzar os nossos resultados com os resultados previamente publicados para os referidos conjuntos de dados. , en=This work addresses the automated dating of textual documents, i.e. the task of determining when a document is about or when it was written, based only on its text. We rely solely on temporal cues implicit in the text, and advance over previous work in the area by proposing a method based on a deep neural network. The proposed neural architecture explores the hierarchical nature of the input data (i.e., documents are modeled as sequences of sentences, which in turn correspond to sequences of words), combining pre-trained word embeddings, recurrent units and neural attention, for generating intermediate representations of the textual contents. To validate the presented model, this work also presents a series of experimental results in four datasets, with different characteristics and which help us to cross our results to the ones previously presented. }
{pt=Datação Automática, Mecanismo de Atenção, Rede Neuronal Profunda, Word Embeddings, en=Automatic Dating, Attention Mechanism, Deep Neural Network, Word Embeddings}

Novembro 15, 2017, 15:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Daniel Gomes

Fundação para a Computação Científica Nacional

Investigador Coordenador