Dissertação

Histogram Algebra: an Application to Histogram Principal Component Analysis EVALUATED

Nos últimos anos, a Análise de Dados Simbólicos tem vindo a tornar-se uma área cada vez mais importante da Estatísitica, devido à crescente complexidade dos dados a serem tratados. Um dos tipos de variáveis simbólicas mais utilizado é o histograma, que contém informação sobre a distribuição de probabilidades dos indíviduos que a originaram. Por este motivo, é importante encontrar formas de manipular e fazer operações aritméticas de um modo fácil com este tipo de variável. Dado que as variáveis intervalares constituem um tipo específico de variáveis histograma, estas merecerão também particular atenção neste trabalho. Após ter incidido o foco na criação de uma álgebra de histogramas, baseada nas operações aritméticas com funções quantil, que é uma das formas possíveis de representar histogramas, é obtida uma expressão geral para o cálculo de combinações lineares entre histogramas. A expressão mencionada acima é posteriormente utilizada para sugerir um novo método de estimação para a Análise Simbólica de Componentes Principais, quando este é aplicado a dados histograma. Como resultado, o método representa as observações originais, em forma de histograma multivariado, no espaço gerado pelas componentes principais simbólicas, ao invés do que sucede na larga maioria dos trabalhos nesta área. Este método é aplicado a dois conjuntos de dados, sendo depois analisadas as suas vantagens e limitações, tendo em conta os resultados obtidos.
Análise de Dados Simbólicos, variáveis histograma, funções quantil, álgebra de histogramas, covariância simbólica, Componentes Principais Simbólicas

Dezembro 17, 2019, 10:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Lina Maria Mateus de Oliveira

Departamento de Matemática (DM)

Professor Auxiliar

ORIENTADOR

Maria do Rosário De Oliveira Silva

Departamento de Matemática (DM)

Professor Auxiliar