Dissertação

{en_GB=Machine Learning Techniques for Network Intrusion Detection Systems} {} EVALUATED

{pt=Com a inquestionável dependência que o mundo moderno tem em comunicações por redes de computadores, a necessidade de manter este ambiente seguro torna-se de elevada importância. Ao mesmo tempo, técnicas de \textit{machine learning} têm vindo a melhorar e têm provado ser úteis como uma ferramenta para estudar padrões em grandes quantidades de dados; Portanto, o desenvolvimento de um Sistema de Detecção de Intrusões "inteligente", capaz de combinar esses dois campos de estudo, torna-se uma opção viável. Trabalhos anteriores sobre este tópico concentraram-se na análise de características de pacotes, fluxos de rede e metadados de conexão. Os principais desafios nesses estudos são a falta de dados rotulados e a sua confidencialidade, de modo que a maioria dos trabalhos relacionados focam-se em estudar conjuntos de dados agora obsoletos e não aplicam os seus modelos a tráfego real. Esta tese foca-se na análise de metadados de tráfego de redes, nomeadamente fluxos (\textit{flows}) usando um dataset recente, CICIDS2017. A habilidade de trabalhar apenas com metadados do tráfego garante a vantagem de evitar a encriptação dos dados. É esperado que esta falta de informação reduza a competência do sistema proposto, no entanto os resultados apresentados aqui são promissores o suficiente para que esta alternativa seja levada a sério, e num ambiente de produção esta proposta pode ser usada como um submódulo de um sistema muito maior., en=With the unquestionable dependency of the modern world on network communications, the need to maintain this environment secure becomes of paramount importance. At the same time, machine-learning techniques have improved and proven to be useful as a tool for studying patterns in large amounts of data; hence, the development of an "intelligent" Intrusion Detection System that can combine these two fields of study becomes a viable option. Previous works on this topic have focused on analyzing packet features, network-flows and connection metadata. The main challenges in these studies are the lack of labelled data and its confidentiality, so most have focused on studying now outdated datasets and don't apply their models to real world traffic. This thesis takes focus on traffic metadata analysis, namely network flows information using a recent dataset, CICIDS2017. The ability to perform traffic identification over metadata alone grants the advantage of working as a Network-based IDS, essentially avoiding encryption all together. It is expected that this lack of accessible information will hinder the competence of the proposed system in real world traffic analysis scenarios. However, the results presented are promising enough for this approach to be taken seriously, and furthermore in a production environment, the approach proposed here might be used as a sub-module of a much larger and complete system. }
{pt=Machine Learning, Detecção de Intrusions, IDS, Segurança em Redes, en=Machine Learning, Intrusion Detection, IDS, Network Security}

Junho 19, 2019, 9:0

Orientação

ORIENTADOR

Pedro Miguel dos Santos Alves Madeira Adão

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

Ricardo Simões do Canto de Loura

Mediceus

Analista