Dissertação

{en_GB=Big Data Privacy by Design Computation Platform} {} EVALUATED

{pt=Vivemos na era das grandes quantidades de dados (Big Data). Os dados pessoais dos utilizadores, em particular, são necessários para o desenvolvimento, funcionamento e melhoria constante de serviços disponíveis na Internet, nomeadamente o Google, Facebook, WhatsApp, Spotify, entre tantos outros. Muitas vezes, a recolha e o uso dos dados pessoais não são explícitos para os utilizadores, embora a sua utilização seja central para o modelo de negócios das empresas. No entanto, o direito à privacidade de cada indivíduo tem de ser respeitado. De que forma podem estas duas necessidades conflituantes ser reconciliadas, ou seja, como podemos construir sistemas de Big Data que respeitem a privacidade do utilizador? O objectivo deste trabalho é desenhar e implementar uma “prova de conceito” de uma plataforma para realizar computações que preservem a privacidade dos utilizadores. Pretende-se disponibilizar um método de simples utilização para a implementação de técnicas de preservação da privacidade. Este sistema pode ser utilizado para encapsular algoritmos que permitam, por exemplo, monitorizar os sinais vitais dos pacientes (sem os expor a outras pessoas), produzir recomendações em tempo real com base na localização (mas sem a divulgação da mesma). Assim, esta “prova de conceito” implementa versões de algoritmos de aprendizagem automática que preservam a privacidade, e fornece um referencial que permite uma melhor compreensão das relações e benefícios criados com o uso de técnicas de preservação de privacidade., en=We live in the age of Big Data. Personal user data, in particular, are necessary for the operation and improvement of everyday Internet services like Google, Facebook, WhatsApp, Spotify. Many times, the capture and use of personal data are not made explicit to the users, but they are central to the business model of the companies. However, the right to privacy of each individual has to be respected. How can these two conflicting needs be reconciled, i.e. how can we build useful Big Data systems that are respectful of user privacy? The goal of this work is to design and implement a ``proof-of-concept'' of a platform for performing privacy-preserving computations, providing an easy-to-use method to implement privacy-preserving techniques. This system can be used to encapsulate algorithms that can, for example, monitor the vital signs of patients (without exposing the data to other people), produce real-time recommendations based on location (without disclosing the location to others). This proof-of-concept implemented privacy-preserving versions of Machine Learning algorithms and compared them against a baseline reference, allowing a practical understanding of the trade-offs in using privacy-preserving technology.}
{pt=Preservação de Privacidade em Computações, Aprendizagem Automática, Extração de Dados, Grandes Quantidades de Dados, Processamento de Dados, Computação Multi-Entidade Segura, en=Privacy-preserving Computations, Machine Learning, Data Mining, Big Data, Data Processing, Secure Multi-Party Computations}

Junho 7, 2018, 13:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Miguel Filipe Leitão Pardal

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

José Miguel Ladeira Portêlo

Altran Portugal

R&D Project Manager