Dissertação
Predicting Restaurant Inspection Scores Based on Yelp Data and Sanitary Inspection Reports EVALUATED
Este trabalho tem como principal objetivo detetar problemas de higiene e violações dos padrões sanitários em restaurantes, usando informações fornecidas em redes sociais baseadas em localização. Este é um problema bastante comum devido ao número limitado de inspetores em comparação com o número de estabelecimentos. Os inspetores raramente são ajudados por reclamações formais, embora muitas reclamações sejam realmente relatadas na forma de comentários em plataformas sociais. Este projeto de mestrado explora técnicas de machine learning para construir modelos capazes de detetar estabelecimentos que violam padrões de saúde e higiene, baseados em comentários textuais retirados de plataformas sociais (neste caso, do Yelp). O projeto explora mecanismos de classificação de texto baseados em redes neurais profundas, inspirando-se em trabalhos recentes no campo do Processamento de Linguagem Natural (NLP). Este projeto usou um conjunto de dados fornecido pela plataforma Yelp, mas alguns dados foram recolhidos por mim para aumentar o número de reviews de cada estabelecimento. Para tal, recorri à API do Yelp, que permitiu procurar o máximo de reviews possíveis para cada estabelecimento e apoiar a parte de treino e a avaliação dos métodos a serem desenvolvidos. Os resultados obtidos foram testados com algumas métricas de avaliação. As métricas de desempenho mostraram que as redes neurais recorrentes alcançaram melhores resultados do que o outro modelo. Finalmente, quando o conjunto de dados foi equilibrado, foi o melhor resultado alcançável.
novembro 2, 2018, 14:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Bruno Emanuel Da Graça Martins
Departamento de Engenharia Informática (DEI)
Professor Auxiliar
ORIENTADOR
Mário Jorge Costa Gaspar da Silva
Departamento de Engenharia Informática (DEI)
Professor Catedrático