Disciplina
Análise e Integração de Dados
Área
Área Científica de Sistemas de Informação > Tecnologias de Sistemas de Informação
Activa nos planos curriculares
MEIC-T 2018 > MEIC-T 2018 > 2º Ciclo > Agrupamentos > Sistemas de Informação > Análise e Integração de Dados
MEIC-A 2018 > MEIC-A 2018 > 2º Ciclo > Agrupamentos > Sistemas de Informação > Análise e Integração de Dados
MEIC-T 2021 > MEIC-T 2021 > 2º Ciclo > Área Principal > Agrupamentos > Sistemas de Informação > Análise e Integração de Dados
MECD2019 > MECD2019 > 2º Ciclo > Opções > Análise e Integração de Dados
MEIC-T 2015 > MEIC-T 2015 > 2º Ciclo > Agrupamentos > Bioinformática e Biologia Computacional > Análise e Integração de Dados
MEIC-A 2021 > MEIC-A 2021 > 2º Ciclo > Area Principal > Agrupamentos > Sistemas de Informação > Análise e Integração de Dados
MEIC-A 2015 > MEIC-A 2015 > 2º Ciclo > Agrupamentos > Bioinformática e Biologia Computacional > Análise e Integração de Dados
MEIC-A 2006 > MEIC-A 2006 > 2º Ciclo > Área de Especialização Complementar > Sistemas de Informação Empresariais > Análise e Integração de Dados
MEIC-T 2006 > MEIC-T 2006 > 2º Ciclo > Áreas de Especialização Complementares > Sistemas de Informação Empresariais > Análise e Integração de Dados
Nível
Nota Final = 40% Projeto + 60% Exame Nota mínima de 9.5 em ambas as componentes. Avaliação TE e Época Especial só por exame.
Tipo
Não Estruturante
Regime
Semestral
Carga Horária
1º Semestre
2.0 h/semana
1.5 h/semana
119.0 h/semestre
Objectivos
Compreender e implementar processos de extração, transformação e carregamento de dados utilizando métodos e ferramentas actuais. Conhecer os diferentes tipos de arquiteturas e opções de desenho para grandes armazéns de dados. Aplicar métodos e ferramentas de análise multidimensional sobre armazéns de dados.
Programa
Revisão de SQL. Processos e ferramentas ETL. Fontes de dados e integração de dados. Mapeamento e alinhamento de dados. Comparação de cadeias de carateres. Perfilação e limpeza de dados. Deteção e remoção de duplicados. Armazéns de dados. Desenho lógico e físico de armazéns de dados. Processos ETL para armazéns de dados. Análise multidimensional sobre armazéns de dados. Extensões à linguagem SQL e linguagem MDX. Geração automática de relatórios. Indicadores de desempenho.
Metodologia de avaliação
Nota Final = 40% Projeto + 60% Exame Nota mínima de 9.5 em ambas as componentes. Avaliação TE e Época Especial só por exame.
Pré-requisitos
Bases de Dados; SQL
Componente Laboratorial
Realização de guias laboratoriais sobre plataforma de software e ferramentas fornecidas em máquina virtual. Realização de projeto de armazém de dados e análise multidimensional.
Princípios Éticos
Todos os membros de um grupo são responsáveis pelo trabalho do grupo. Em qualquer avaliação, todo aluno deve divulgar honestamente qualquer ajuda recebida e fontes usadas. Numa avaliação oral, todo aluno deverá ser capaz de apresentar e responder a perguntas sobre toda a avaliação.
Componente de Programação e Computação
N/A
Componente de Competências Transversais
Desenvolvimento de pensamento crítico, estratégia de resolução de problemas, trabalho em equipa, e comunicação inter-pessoal na resolução do projeto.
Bibliografia
Principal
Principles of Data Integration
Anhai Doan, Alon Halevy and Zachary Ives
Data Warehouse Systems: Design and Implementation
Alejandro Vaisman and Esteban Zimányi