Dissertação

{pt_PT=Cybersecurity Threat Management - Intelligent Data Reduction} {} EVALUATED

{pt=Devido ao acréscimo de ataques informáticos registado na última década, várias organizações dos mais diversos setores como energia, saúde e aviação já implementaram sistemas de segurança informática tipicamente compostos por tecnologias de antivírus e firewall e mecanismos de detecção de intrusão. De forma a reduzir os custos de armazenamento de dados e a complexidade dos sistemas atuais, os principais objetivos desta dissertação são simular o funcionamento de diferentes sistemas de detecção de intrusão, implementando algoritmos de aprendizagem automática, e, construir uma ferramenta integrável capaz de reduzir a quantidade de dados informáticos a armazenar para 20% das necessidades atuais. Para atingir estes objetivos é utilizada uma base de dados pública construída com base em eventos informáticos ocorridos na Universidade de Quioto. Tradicionalmente, os sistemas de detecção de intrusão são compostos por três elementos: recolha de dados, preprocessamento e reconhecimento de ataques. Nesta dissertação, uma nova abordagem, contendo um novo bloco destinado à redução de informação entre as etapas de preprocessamento e reconhecimento de ataques, é proposta. Este novo bloco é aplicado através de um algoritmo de seleção de variáveis do tipo filtro, baseado em análise de redundância e relevância. Os modelos de aprendizagem automática aqui implementados para reconhecimento de ataques são redes neuronais, Bayes "ingénuo" e floresta aleatória. Para potenciar as suas capacidades, os hiper-parâmetros que os definem são otimizados utilizando pesquisa aleatória. No final, a capacidade de detecção de ataques dos vários sistemas é averiguada de modo a demonstrar os benefícios inerentes à ferramenta de redução de informação estudada. , en=Due to the boost of cyber attacks registered in the past decade, many organizations from various sectors as energy, healthcare and even aviation have already implemented cyber security strategies commonly composed of antivirus and firewall technologies and intrusion detection systems. In order to reduce the digital data storage expenses and the complexity of the prevailing systems, this thesis main objectives are to simulate the operation of different intelligent intrusion detection systems, by implementing machine learning algorithms, and to build a filtering tool capable of reducing the digital storage usage to 20% of the present needs while improving data understanding. To achieve these goals, a benchmark database based on cyber events from Kyoto University is explored. Traditionally, intrusion detection systems consist on three distinct elements: data collection, data preprocessing and intrusion detection. Here, a novel approach, containing a data reduction tool between the data preprocessing and the actual intrusion detection, is proposed. In order to guarantee an improvement of data understanding and a fast computation process, the fast correlation-based filter, a feature selection filter based on relevance and redundancy analysis, is implemented as data reduction mechanism. The machine learning models applied to simulate the attack recognition process are artificial neural networks, naive Bayes and random forests. To do so, the models' hyperparameters are selected based on a random search optimization. At last, the detection capabilities of the complete system are inquired in order to demonstrate the benefits of the data reduction mechanism studied. }
{pt=cibersegurança, detecção de intrusão, aprendizagem automática, redução de dados, seleção de variáveis, métodos filtro, en=cybersecurity, intrusion detection system, machine learning, data reduction, feature selection, filter methods}

Novembro 29, 2018, 11:30

Orientação

ORIENTADOR

Susana Margarida da Silva Vieira

Departamento de Engenharia Mecânica (DEM)

Professor Auxiliar

ORIENTADOR

João Miguel Da Costa Sousa

Departamento de Engenharia Mecânica (DEM)

Professor Catedrático