Dissertação

Classical and Robust Symbolic Principal Component Analysis for Interval Data EVALUATED

A análise em componentes principais é um dos métodos estatísticos mais populares para analisar dados reais. Por este motivo, tem havido várias propostas para estender esta metodologia para o enquadramento da análise de dados simbólicos, nomeadamente para dados intervalares. Nesta tese, deduzimos as formulações populacionais para quatro destes algoritmos: Método dos Centros, Método dos Vértices, Complete Information Principal Component Analysis and Symbolic Covariance Principal Component Analysis. Com base nessas formulações teóricas, propomos uma metodologia geral que fornece simplificações, conhecimento adicional e unificação dos métodos discutidos. Adicionalmente, é derivada uma fórmula explícita e simples para a definição dos scores das componentes principais simbólicas, equivalente à representação por Maximum Covering Area Rectangles. Além disso, a existência de observações atípicas poderia distorcer as componentes principais simbólicas amostrais e os respetivos scores. Para ultrapassar este problema, propomos duas famílias de métodos robustos para análise em componentes principais simbólicas: um baseado em matrizes de covariância robustas e outro baseado em Projection Pursuit. É efetuado um estudo de simulação para avaliar o desempenho desses procedimentos, que nos permite concluir que estes podem acomodar pequenos desvios do modelo central especificado. Finalmente, para que todas estas novas metodologias propostas sejam facilmente utilizadas na análise de dados reais, desenvolvemos uma aplicação web, utilizando a plataforma Shiny do R. Na nossa aplicação, de forma interativa, é possível analisar, visualizar e comparar os resultados das componentes principais clássicos e robustas, para dados convencionais e dados intervalares. Ilustramos algumas das suas potencialidades com um conjunto de dados das telecomunicações.
Análise de dados simbólicos, variáveis intervalares, análise em componentes principais, estatística robusta.

Dezembro 16, 2015, 14:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Maria do Rosário De Oliveira Silva

Departamento de Matemática (DM)

Professor Auxiliar