Dissertação

{en_GB=Detecting Popularity and Innovation on Twitter to Find the Best stocks in SP500} {} EVALUATED

{pt=Nos últimos anos, as redes sociais tornaram-se um dos principais fatores a influenciar os valores das ações do mercado financeiro. O interesse dos investidores em minimizar o risco ao apostar no mercado financeiro aumentou com a possibilidade de prever as suas alterações tendo por base a classificação sentimental de opiniões expressas no Twitter. Neste trabalho, é demonstrado como o conteúdo do Twitter pode ser usado para detetar empresas inovadoras e populares no mercado de índices S&P500. A recolha de informação é realizada através de um robot que recolhe tweets, através da API de pesquisa do Twitter, tendo por base palavras previamente escolhidas e relacionadas com os dois temas em estudo. Com o objetivo de analisar a informação contida nos tweets e classificar as opiniões relacionadas com a inovação e popularidade das empresas como positivas, negativas ou neutras, foi implementado um classificador Naïve Bayes com uma precisão de 70,6%. Para inferir quais, das palavras selecionadas, são mais influentes na deteção de empresas inovadoras e populares, foi implementado um algoritmo genético. Com base nesses resultados é realizada uma previsão em tempo real dos valores de mercado das ações do S&P500 para detetar quais são as empresas mais inovadoras e populares para os investidores apostarem. Os melhores resultados foram bastante interessantes, tendo-se obtido um lucro máximo de 11,8% para o caso da Inovação e 5,5% para o caso da Popularidade., en=In the past years, social media has become one of the main sources related to the up and down movement of the financial market. The interest of investors in minimizing the risks when wagering in the financial market has increased with the possibility of predicting its up’s and down’s based on the sentiment classification of Twitter’s user’s opinions. In this paper, it is demonstrated how Twitter can be used to detect innovative and popular companies in the S&P500 index market. The collection of data is done through a robot that collects tweets from Twitter search API based on words, previously selected and related to those two subjects of interest. In order to analyse the text content of tweets and to classify a company’s innovation/popularity opinions either as a positive, negative or neutral opinions, it is implemented a Naïve Bayes classifier, with an accuracy of 70,6%. To infer which of the selected words are more influent in the detection of innovative and popular companies, a Genetic Algorithm is implemented. A forecasting of real-time outcomes of the S&P500 stock market values is calculated based on results obtained from the Genetic Algorithm, to detect which are the most innovative and popular companies for investors to wager. The best results were a profit of 11,8% for the Innovation study and 5,5% for the Popular study.}
{pt=Twitter, Mercado Financeiro, Algoritmo Genético, Naïve Bayes, Deteção de Popularidade/Inovação, en=Twitter, Stock Market, Genetic Algorithms, Naïve Bayes, Popularity/Innovation detection}

Outubro 29, 2018, 14:0

Orientação

ORIENTADOR

Nuno Cavaco Gomes Horta

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado

ORIENTADOR

Rui Fuentecilla Maia Ferreira Neves

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar