Dissertação

Symbolic Formulation for Principal Component Analysis of Interval Valued Data EVALUATED

Neste trabalho estabelecemos os fundamentos teóricos necessários para poder aplicar Análise de Componentes Principais -- um método estatístico comummente usado para reduzir a dimensão de conjuntos de dados -- à área de Análise de Dados Simbólicos -- uma área da estatística que estuda dados não convencionais --, criando assim um método de Análise de Componentes Principais Simbólicas. Desenvolvemos a teoria necessária para garantir que os algoritmos são matematicamente coerentes e apresentamos algumas propriedades dos mesmos. Mostramos ainda que os métodos derivados são inerentemente flexíveis, o que permite que a teoria seja desenvolvida de um modo genérico, que facilita a incorporação de futuros avanços na área. Também propomos uma versão robusta dos métodos apresentados e usamos um estudo de simulação minucioso para confirmar que a formulação robusta é apropriada. Depois dos desenvolvimentos teóricos implementamos os algoritmos todos na linguagem de programação R, também num estilo que permita a sua fácil extensão no futuro. As implementações são usadas, de seguida, para explorar um conjunto de dados através da interpretação das componentes principais simbólicas.
Análise de Dados Simbólicos, Componentes Principais Simbólicas, Estatística Robusta, Álgebra Intervalar

Janeiro 28, 2021, 9:30

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Lina Maria Mateus de Oliveira

Departamento de Matemática (DM)

Professor Auxiliar

ORIENTADOR

Maria do Rosário De Oliveira Silva

Departamento de Matemática (DM)

Professor Associado