Dissertação

{en_GB=Learning About Clients from Call Graph} {} EVALUATED

{pt=Com base em dados fornecidos por uma operadora de telecomunicações com informação anonimizada sobre comunicações móveis, o objective desta tese é representar a rede social de utilizadores de telemóveis num grafo e avaliar até que ponto é que métricas associadas à estrutura gráfica podem melhorar a previsão de género e idade dos utilizadores com base na informação disponibilizada. A rede de utilizadores de telemóveis é apresentada numa estrutura gráfica para facilitar a compreensão dos seus comportamentos. Análise exploratória de dados é feita com o objectivo de avaliar a qualidade dos dados disponibilizados e investigar estratégias sociais que possam ser traduzidas na estrutura da rede. Visto que os métodos de state of the art são irreproduzíveis, é proposta uma abordagem inicial com classificadores. O objectivo é validar as melhorias que advêm da introdução de métricas de rede como features na previsão de idade e género de utilizadores de telemóveis. Ainda que os métodos de classificação em árvore testados não apresentem boas performances, este estudo serve de ponto de partida para o desenvolvimento de métodos de inferência que melhor aproveitem a estrutra de rede, como é o caso de modelos probabilisticos gráficos. Esta tese demonstra que é possível associar estratégias sociais de utilizadores de telemóvel em rede às suas propriedades demográficas. Apesar dos métodos de classificação testados apresentarem ligeiras melhorias de performance, é possível concluir que o problema de inferência demográfica através de redes de utilizadores de telemóveis pode tirar grande partido de modelos que explorem precisamente a estrutura gráfica da rede., en=Based on a dataset provided by a telecommunications operator with fully anonymized information about mobile phone communications, the objective is to construct a mobile call graph and evaluate to which extent are network metrics informative for the prediction of age and gender of users from the call graph. A mobile call graph is constructed to represent the social network of mobile phone users and facilitate the understanding of their communication behaviors. Extensive exploratory data analysis is performed to assess the quality of the data and investigate social strategies associated to the network structure. Since the state of the art is not reproducible, a preliminary approach with classical classification methods is proposed for gender and age inference in order to assess the added value of network metrics as features. This thesis shows in detail that several social behaviors adopted by mobile phone users can be identified in call graphs, mostly in accordance to state of the art based on other datasets, thus proving the correlation between demographics and mobile phone communication behaviors within the network. Classification tree-based methods are tested with and without network features as predictors, with negligible performance difference. Therefore, even though the state of the art and the social strategies confirmed in this dataset show the merit of network structure in inference, the tree-based classifiers do not benefit much from it. This verification opens the door for exploring more complex graph-based models, such as probabilistic graphical models, which can better leverage the network structure for improved prediction. }
{pt=Classificadores, Estratégias sociais, Grafo, Modelos probabilisticos gráficos, Padrões de comunicação, Predição demográfica, en=Classifiers, Communication behaviours, Demographic prediction, Mobile Call Graph, Social strategies, Probabilistic Graphical Models}

Junho 12, 2018, 12:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Cláudia Alexandra Magalhães Soares

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Prof Auxiliar Convidado