Dissertação

Collection and classification of telecom-related fast-text news and events EVALUATED

A qualidade da rede fornecida pelas operadoras de telecomunicações pode ser afetada por diferentes tipos de eventos externos. Para além das métricas já monitorizadas pelas empresas poderão haver fontes externas que fornecam informação relevante acerca de eventos que comprometam o correto funcionamento da rede. O trabalho proposto identifica e classifica automaticamente eventos presentes em notícias e ocorrências da proteção civil, correlacionando-os com problemas da rede reportados pela equipe de SSO. Foi desenvolvida uma arquitetura que coleta periodicamente informações desses eventos para processamento, classificação e armazenamento em uma base de dados usando tecnologias como Docker, Maven, Quarkus e Kafka. Os modelos SVM, KNN e FFP foram usados para classificarem pequenos textos de notícias portuguesas, escolhendo com base no título e breve descrição. Os primeiros resultados mostram pontuações F1 acima de 0,68 para cada classe, considerando um conjunto de dados desequilibrado com 14.000 amostras e 4 classes. Esses resultados são promissores, considerando a complexidade do problema e as características do conjunto de dados utilizados.
Classificação de texto, Support Vector Machines, Fuzzy Fingerprints, K-nearest neighbors, ETL

julho 5, 2023, 9:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

João Paulo Baptista de Carvalho

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Associado

ORIENTADOR

Cristina João Pires

Altice Labs

Especialista