Dissertação
Descoberta de dados pessoais, potencialmente sensíveis EVALUATED
A inovação tecnológica dos últimos anos, designadamente a relacionada com a automatização dos processos das organizações, conduziu à massificação do volume de dados armazenados. Muitos dos dados que as organizações manuseiam na realização das suas atividades diárias são, grande parte, dados de natureza pessoal e por isso de caracter sensível. Com a entrada em vigor do regulamento geral de proteção de dados, no espaço europeu, é vital garantir a proteção dos titulares dos dados e verificar se as organizações estão a cumprir com o preceituado no regulamento. O trabalho relaciona como a descoberta de dados pode ser realizada recorrendo às técnicas de data mining, machine learning, extração de informação em dados estruturados e não estruturados. Estende-se aos desafios do processamento da língua natural através de produtos de fonte aberta que utilizem ferramentas, utilitários e bibliotecas para perceber de que forma é que podem ser aplicadas na descoberta de dados pessoais. A solução proposta é assente na instanciação de um protótipo capaz de descobrir de uma forma automática potenciais dados sensíveis na língua portuguesa através de atributos selecionados e apresentar um método que demonstre a capacidade para lidar com o ciclo do tratamento de dados. Constata-se que o desafio não se restringe apenas à descoberta de dados, é preciso treinar modelos NLP com vista a alcançar bons resultados. Assim como, é imprescindível aliar a segurança tecnológica à privacidade dos dados, envolvendo as áreas de negócio através de aproximações sucessivas ao longo de todo o processo de tratamento de dados pessoais.
novembro 12, 2018, 14:30
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
José Manuel da Costa Alves Marques
Departamento de Engenharia Informática (DEI)
Professor Catedrático