Dissertação

{en_GB=Feature Engineering for Click Prediction} {} EVALUATED

{pt=No mundo de anúncios online a tarefa de Previsão de clicks envolve, analisar diferentes atributos de modo a concluir que anúncios apresentam maior probabilidade de serem clicados. Os atributos nem sempre partilham do mesmo tipo, estes dividem-se essencialmente em dois: numéricos; e categóricos. Em geral, estes atributos, devem ser processados de modo a poderem ser utilizados como entrada para o nosso modelo de previsão. Métodos tais como: ”one hot encoding ”; ”label encoding”; para atributos categóricos; normalização caso os mesmos sejam numéricos. Adicionalmente, estes podem ser combinados de modo a gerar novos atributos com intuito de melhorar a precisão do nosso modelo, processo este denominado extração de atributos ( Feature Engineering ). Nos últimos anos, muitos modelos foram desenvolvidos com a habilidade de efectuar este processo de forma automatizada, isto é, gerando combinações de características. Neste trabalho, iremos aplicar e estudar diferentes modelos em conjuntos de dados reais. Sendo que, ao avaliar a performance destes algoritmos conseguiremos inferir sobre que operações são responsáveis pelo do seu sucesso., en=Click prediction in online advertising involves analysing different features in order to estimate the probability that a certain advertisement will be clicked. These features can be of different types, but essentially they can be divided into numerical and categorical. In general, these features must be preprocessed in order to serve as input in a prediction model as one hot vectors or label encoded in case of being categorical, normalised in case of being numerical dense features. In addition these features must be combined in order to generate new features that can improve the accuracy of the predictions, process called Feature engineering. In recent years, several models have been developed to perform these kind of feature engineering automatically by generating combinations of raw features. In this work, we apply and compare several different models for this purpose, and evaluate them on a real-world dataset. Based on these results, we identify the most promising techniques for ad click prediction and explain why they are more successful.}
{pt=Aprendizagem Máquina, Aprendizagem profunda, Extração de Atributos, en=Click-Through Rate, Conversion Rate, Feature Engineering, Deep Learning}

Outubro 7, 2020, 14:30

Orientação

ORIENTADOR

Diogo Manuel Ribeiro Ferreira

Departamento de Engenharia Informática (DEI)

Professor Auxiliar