Dissertação

Neural Methods for Cross-lingual Sentence Compression EVALUATED

A compressão de frases permite produzir uma frase mais pequena ao retirar a informação redundante, mantendo a gramaticalidade. Os sistemas actuais são baseados em redes neuronais que geram uma sequência binária de etiquetas para cada frase: se uma palavra se mantiver da frase original para a compressão é atribuída uma etiqueta com o número um, caso contrário é atribuída a etiqueta zero. Nesta tese, são propostas arquitecturas neuronais que tentam melhorar os sistemas actuais baseados em redes neuronais, especificamente é usado um método que permite gerar globalmente a melhor sequência de etiquetas para uma sequência de palavras, em vez de gerar independentemente como fazem os métodos actuais. Além de estratégias adicionais durante o treino do modelo é também considerado o uso de características sintácticas que podem ajudar a generalizar. Neste trabalho, a tarefa de comprimir frases é também extendida para uma configuração multilíngua que permite gerar compressões em Inglês e Português. A arquitectura proposta conseguiu resultados melhor ou iguais ao avaliar os modelos no mesmo conjunto de dados de teste que os sistemas actuais. Adicionalmente, ao avaliar os modelos nos dados em Português, a arquitectura com melhores resultados apenas usou as palavras de uma sequência, visto que o modelo que continha características sintácticas obteve resultados inferiores.
Compressão de Frases, Sumarização, Redes Neuronais Profundas, Processamento Multilingue, Vectores de Palavras

Junho 7, 2018, 13:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Ricardo Daniel Santos Faro Marques Ribeiro

ISCTE

Professor Auxiliar