Dissertação

GDPR Personal Files Scanner - Automatic classification of files in accordance with the GDPR EVALUATED

O Regulamento Geral sobre a Proteção de Dados (RGPD) é o regulamento europeu sobre a proteção de pessoas no que diz respeito ao processamento e livre circulação de ficheiros pessoais e entrou em vigor em maio de 2018. De acordo com o artigo 5, parágrafo 2, do capítulo 2 do RGPD, os responsáveis pelo tratamento dos dados são responsáveis por todo o ciclo de vida desses mesmos dados pessoais recolhidos até então. A auditoria e a prestação de contas da transferência de dados requerem o desenvolvimento de ferramentas que acompanhem trocas de documentos e dados. Esta tese apresenta o primeiro sistema que processa documentos automaticamente e determina se contêm informações que podem ser consideradas pessoais tendo em conta o RGPD. Utiliza Árvores de Decisão, complementadas por uma série de heurísticas para a criação de vetores de características. Para treinar o sistema, um conjunto de dados foi desenvolvido. Estes documentos podem ser reais ou sintéticos e representam várias classes de documentos que podem conter informações pessoais. O sistema foi implementado usando o Weka, validado contra documentos reais e integrado num servidor de email e foi introduzido a controlar a transferência de dados pessoais para pens USB. O algoritmo atinge uma precisão de 83,3% e 87,4% em diferentes conjuntos de documentos. O uso deste sistema, integrado nas infraestruturas de comunicação eletrónica das empresas (servidor de email, repositórios de documentos), ajudará as empresas a cumprir partes dos requisitos do RGPD, no que diz respeito ao controle das transferências de dados.
Reg.º Geral sobre a Proteção de Dados, Aprendizagem Autónoma, Árvores de Decisão, Detecção de dados pessoais

junho 21, 2019, 14:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

João Nuno De Oliveira e Silva

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar