Dissertação
{pt_PT=DISSERTATION: Entity Linking over Short Texts} {} EVALUATED
{pt=Dada uma entidade (por exemplo, uma localização, uma marca, um clube de futebol, entre outras) mencionada num texto, o objectivo da ligação de entidades é associar a referida entidade à entrada correspondente numa base de conhecimento existente. Este trabalho foca-se em aplicar ligação de entidades em tweets. Neste tipo de texto curto, o seu tamanho (máximo de 140 caracteres) leva à existência de desafios adicionais, nomeadamente o facto destes sofrerem de falta de contexto, ou o facto de usarem linguagem não regular. O trabalho desenvolvido resultou num protótipo, capaz de reconhecer e ligar entidades em textos curtos à página da Wikipedia correspondente. O sistema foi construido usando software previamente desenvolvido, adaptado para ser executado especificamente para texto do Twitter. As experiências feitas neste trabalho provam que, treinando um model de reconhecimento de entidades com dados do Twitter e realizando alterações no texto dos tweets, melhora as performances de ligação de entidades neste tipo de textos., en=Given an entity (e.g., a location, a brand, a football club, among others) mentioned in a text, the task of entity linking is to associate the entity reference to the corresponding entry in an existing knowledge base. This work focus on applying entity linking in tweets. In this type of short text, their size (maximum of 140 characters) leads to the existence of additional challenges, namely the fact that these texts lack on string contextual evidence, or that they may use non-standard vocabulary. The work developed resulted in a prototype system, capable of recognizing and linking entities in short texts to the corresponding Wikipedia page. The system was built by using previously built software, adapted to perform specifically for Twitter text. The experiments performed in this work prove that by training named entity recognition models with Twitter data and by performing changes the text on tweets improves the performance of entity linking for this kind of texts. }
novembro 14, 2016, 9:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar