Dissertação
Prediction of Human Factors in Aviation Incident Reports using Machine Learning and Natural Language Processing EVALUATED
No setor de aviação os fatores humanos são a principal causa de incidentes de segurança. Sistemas preditivos inteligentes, capazes de avaliar o estado humano e gerir riscos, têm vindo a ser desenvolvidos ao longo dos anos para identificar e prevenir estes fatores. No entanto, a falta de grandes quantidades de dados rotulados tem provado uma desvantagem para o desenvolvimento destes sistemas. Esta dissertação propõe e implementa um modelo preditivo para identificar e classificar categorias de fatores humanos a partir de relatórios de incidentes da aviação. Os dados de estudo, fornecidos pela Aviation Safety Network (ASN), abrangem 1.674 relatórios de incidentes entre 2000 e 2020. Uma nova estrutura classificatória de fatores humanos é proposta e um conjunto diversificado de rótulos é desenvolvido, com base nos dados adquiridos. Para a extração de recursos, é desenvolvido um pipeline de pré-processamento de texto e processamento de linguagem natural (NLP). Para a modelagem de dados, são consideradas a técnica semi-supervisionadas de Label Spreading (LS) e a supervisionadas Support Vector Machine (SVM). Os métodos de busca aleatória e otimização Bayesiana são aplicados para análise de hiperparâmetros e melhoria do desempenho do modelo, medido pela pontuação Micro F1. Os melhores modelos preditivos alcançaram resultados Micro F1 de 0,900, 0,779 e 0,875, para cada nível da estrutura de categorização, respetivamente. A solução proposta indica que desempenhos preditivos favoráveis podem ser alcançados para a classificação de fatores humanos com base em dados de texto. Não obstante, um conjunto de dados maior seria recomendado em pesquisas futuras.
janeiro 21, 2021, 11:0
Publicação
Obra sujeita a Direitos de Autor
Orientação
ORIENTADOR
Duarte Pedro Mata de Oliveira Valério
Departamento de Engenharia Mecânica (DEM)
Professor Associado