Dissertação

Predicting Restaurant Inspection Scores Based on Yelp Data and Sanitary Inspection Reports EVALUATED

Este trabalho tem como principal objetivo detetar problemas de higiene e violações dos padrões sanitários em restaurantes, usando informações fornecidas em redes sociais baseadas em localização. Este é um problema bastante comum devido ao número limitado de inspetores em comparação com o número de estabelecimentos. Os inspetores raramente são ajudados por reclamações formais, embora muitas reclamações sejam realmente relatadas na forma de comentários em plataformas sociais. Este projeto de mestrado explora técnicas de machine learning para construir modelos capazes de detetar estabelecimentos que violam padrões de saúde e higiene, baseados em comentários textuais retirados de plataformas sociais (neste caso, do Yelp). O projeto explora mecanismos de classificação de texto baseados em redes neurais profundas, inspirando-se em trabalhos recentes no campo do Processamento de Linguagem Natural (NLP). Este projeto usou um conjunto de dados fornecido pela plataforma Yelp, mas alguns dados foram recolhidos por mim para aumentar o número de reviews de cada estabelecimento. Para tal, recorri à API do Yelp, que permitiu procurar o máximo de reviews possíveis para cada estabelecimento e apoiar a parte de treino e a avaliação dos métodos a serem desenvolvidos. Os resultados obtidos foram testados com algumas métricas de avaliação. As métricas de desempenho mostraram que as redes neurais recorrentes alcançaram melhores resultados do que o outro modelo. Finalmente, quando o conjunto de dados foi equilibrado, foi o melhor resultado alcançável.
Aprendizagem Profunda, Classificação de Texto.

novembro 2, 2018, 14:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Mário Jorge Costa Gaspar da Silva

Departamento de Engenharia Informática (DEI)

Professor Catedrático