Dissertação

{en_GB=Website analysis: Finding Fraud Patterns in Web Pages} {} EVALUATED

{pt=Na última década, a fraude em publicidade online tem sido um problema crescente, prejudicando cada vez mais os negócios das empresas. Existem várias ferramentas no mercado que visam a proteção contra fraudes publicitárias e, para isso, a Phybbit, empresa japonesa, criou a SpiderAF. Um dos seus recursos é a inclusão de uma blacklist de sites que inclui sites fraudulentos. Um site é classificado como fraudulento depois dos seus atributos e do conteúdo das suas páginas terem sido analisados em relação a padrões de fraude conhecidos. No mundo em constante evolução da web e da fraude publicitária, novos padrões continuam a surgir e a sua rápida detecção é a chave para evitar que a fraude afete o orçamento dos anunciantes. Propomos a aplicação de técnicas de Visualização de Informação com o objetivo de criar um sistema onde investigadores possam consultar os dados das várias páginas web e encontrar padrões de fraude, proporcionando uma alternativa mais eficiente ao que está disponível hoje. Os padrões de fraude recém-descobertos podem então ser usados diretamente para analisar novos sites, contribuindo para a proteção do ecossistema da publicidade digital. Desenvolvemos o sistema seguindo um design iterativo e incremental, em estreita colaboração com a Phybbit. Para validar a nossa solução, realizamos uma avaliação de usabilidade e uma avaliação de utilidade feita por investigadores da Phybbit. O sistema cumpriu os objetivos propostos e apresentou resultados promissores nas avaliações de usabilidade e utilidade., en=In the past decade, online advertisement fraud has been a growing issue, increasingly harming companies' business. There are several tools in the market that aim at protecting against advertisement fraud and, for this, Phybbit, a Japanese company, created SpiderAF. One of its unique features is the inclusion of a website blacklist that includes fraudulent websites. A website is classified as fraudulent after its web pages attributes and content were analyzed against know fraud patterns. In the ever evolving world of the web and advertisement fraud, new patterns keep emerging and its rapid detection is key to prevent fraud from impacting advertisers budget. We propose the application of Information Visualization techniques in order to create a system where researchers can look at the data from the several web pages and find fraud patterns, providing a more efficient alternative to what is available today. The newly discovered fraud patterns can then be used directly to analyze new websites, contributing to the protection of the digital advertisement ecosystem. We developed the system following an iterative and incremental design, closely with Phybbit. To validate our solution we conducted an usability evaluation and a utility evaluation done by Phybbit’s researchers. The system met the proposed objectives and showed promising results on both usability and utility evaluations.}
{pt=Visualização de Informação, Fraude em anúncios online, Análise de websites, Padrões de fraude, en=Information Visualization, Online advertisement fraud, Website analysis, Fraud Patterns}

Outubro 9, 2020, 10:30

Orientação

ORIENTADOR

Sandra Pereira Gama

Departamento de Engenharia Informática (DEI)

Colaborador Docente

ORIENTADOR

Eurico José Teodoro Doirado

Phybbit

CTO - Phybbit