Dissertação

{pt_PT=DISSERTATION: Entity Linking over Short Texts} {} EVALUATED

{pt=Dada uma entidade (por exemplo, uma localização, uma marca, um clube de futebol, entre outras) mencionada num texto, o objectivo da ligação de entidades é associar a referida entidade à entrada correspondente numa base de conhecimento existente. Este trabalho foca-se em aplicar ligação de entidades em tweets. Neste tipo de texto curto, o seu tamanho (máximo de 140 caracteres) leva à existência de desafios adicionais, nomeadamente o facto destes sofrerem de falta de contexto, ou o facto de usarem linguagem não regular. O trabalho desenvolvido resultou num protótipo, capaz de reconhecer e ligar entidades em textos curtos à página da Wikipedia correspondente. O sistema foi construido usando software previamente desenvolvido, adaptado para ser executado especificamente para texto do Twitter. As experiências feitas neste trabalho provam que, treinando um model de reconhecimento de entidades com dados do Twitter e realizando alterações no texto dos tweets, melhora as performances de ligação de entidades neste tipo de textos., en=Given an entity (e.g., a location, a brand, a football club, among others) mentioned in a text, the task of entity linking is to associate the entity reference to the corresponding entry in an existing knowledge base. This work focus on applying entity linking in tweets. In this type of short text, their size (maximum of 140 characters) leads to the existence of additional challenges, namely the fact that these texts lack on string contextual evidence, or that they may use non-standard vocabulary. The work developed resulted in a prototype system, capable of recognizing and linking entities in short texts to the corresponding Wikipedia page. The system was built by using previously built software, adapted to perform specifically for Twitter text. The experiments performed in this work prove that by training named entity recognition models with Twitter data and by performing changes the text on tweets improves the performance of entity linking for this kind of texts. }
{pt=Processamento de Linguagem Natural, Aprendizagem Automática, Extração de Informação, Reconhecimento de Entidades, Ligação de Entidades, en=Natural Language Processing, Machine Learning, Information Extraction, Named Entity Recognition, Entity Linking}

novembro 14, 2016, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Pável Pereira Calado

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar