Dissertação

{en_GB=Sparse Dynamic Bayesian network estimation using generalized linear models} {} EVALUATED

{pt=As redes Bayesianas Dinâmicas são modelos probabilísticos gráficos usados para a modelação de processos estocásticos. Atendendo às recentes aplicações de data mining, estes modelos podem ser treinados com séries temporais multivariadas e a sua interpretação permite encontrar relações interessantes entre as variáveis medidas. Os algoritmos de aprendizagem ótimos têm, contudo, uma elevada complexidade computacional. Esta dificuldade inspira o desenvolvimento de novas técnicas que recorrem a procedimentos heurísticos para reduzir o espaço de procura. Esta dissertação introduz um método de treino chamado sDBN, que possui uma complexidade computacional mais atrativa e pode ser utilizado para dados com alta dimensionalidade. Esta nova técnica recorre a métodos recentes que ligam o treino de redes Bayesianas discretas com modelos lineares generalizados. O método proposto treina redes estacionárias e não estacionárias, recebendo como entrada um atraso de Markov. Os resultados experimentais mostram que o algoritmo proposto consegue identificar redes válidas e atinge recuperação perfeita de estruturas com dimensão elevada, utilizando dados simulados. Neste contexto, o algoritmo supera os métodos mais avançados disponíveis em termos de qualidade e de tempo de treino. Ao classificar séries temporais reais, o sDBN mostra também resultados competitivos. Em dados médicos de pacientes com Espondilite Anquilosante, retirados do Reuma.pt, uma base de dados nacional de doentes reumáticos, o algoritmo recupera estruturas inteligíveis e consegue prever a progressão da doença. Estes resultados posicionam o sDBN como um método alternativo viável para o treino de redes Bayesianas dinâmicas e sugerem que o algoritmo pode ser treinado com dados de alta dimensionalidade., en=Dynamic Bayesian Networks (DBNs) are probabilistic graphical models used to predict the evolution of stochastic processes. Following recent trends in data mining, these models can be trained from multivariate time-series data to uncover interesting temporal relationships between measured variables. However, optimal training algorithms are computationally prohibitive which inspires the development of heuristic techniques to prune the search space. This dissertation introduces sDBN, an alternative training algorithm with better computational complexity that can handle high-dimensional data. This method leverages state-of-the-art techniques that bridge discrete Bayesian network training with generalized linear models, extending them to handle temporal data. The proposed method handles both stationary and non-stationary models and is flexible to a specified Markov lag. Empirical results show that the algorithm achieves meaningful network identification, accomplishing up to perfect F1 scores in artificial datasets with a considerable number of dimensions. Using simulated data, sDBN outperforms state-of-the-art dynamic Bayesian network training algorithms both in terms of structure quality, and training time. Tests in benchmark public datasets show that sDBN is also competitive in time-series classification. Using Ankylosing Spondylitis patient data from Reuma.pt, a national rheumatological registry, the new method recovers intelligible models and successfully predicts disease progression. These results validate the novel algorithm as an alternative methodology to identify dynamic Bayesian networks from data and suggest that this algorithm enables training using high-dimensional datasets.}
{pt=séries temporais multivariadas, redes Bayesianas dinâmicas, modelos lineares generalizados, aprendizagem automática de estrutura, dados de alta dimensionalidade, data mining, en=multivariate time-series, dynamic Bayesian networks, generalized linear models, structure learning, high-dimensional data, data mining}

setembro 26, 2021, 9:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Susana de Almeida Mendes Vinga Martins

Departamento de Bioengenharia (DBE)

Professor Associado

ORIENTADOR

Alexandra Sofia Martins de Carvalho

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar