Disciplina Curricular
Métodos Estatísticos em Data Mining MEDM
Mestrado Bolonha em Engenharia e Ciência de Dados - MECD2019
Contextos
Grupo: MECD2019 > 2º Ciclo > Opções
Período:
Grupo: MECD2019 > 2º Ciclo > Opções
Período:
Peso
6.0 (para cálculo da média)
Pré-requisitos
Probabilidade e Estatística.
Objectivos
Apresentar as potencialidades dos métodos estatísticos de data mining, dando-se especial relevo a métodos de classificação, agrupamento, redução de dimensionalidade, detecção de anomalias e mínimos quadrados parciais. Desenvolver competências para a aplicação de procedimentos estatísticos à análise de grandes conjuntos de dados e reconhecer como a utilização correcta de tais procedimentos é importante na tomada de boas decisões. Analisar problemas reais com a ajuda de software específico e reconhecer as metodologias adequadas à sua resolução. No final do semestre, os alunos deverão conhecer os principais procedimentos estatísticos associados à utilização de data mining e ter conhecimentos, a nível de utilizador, de outras técnicas de data mining.
Programa
Visão Geral dos problemas de Data Mining: Objectivos e Ferramentas. A importância da análise exploratória de dados: Pré-processamento, Visualização e Qualidade dos Dados. Métodos de classificação: Método dos K-Vizinhos mais próximos - Regra de Decisão de Bayes e Ingénua de Bayes - Árvores de Decisão - Regressão Logística. Avaliação do Desempenho de um Classificador. Comparação de Classificadores. Métodos de agrupamento em dados estáticos e em dinâmicos . Redução da Dimensionalidade. Deteção de anomalias em dados estáticos e dinâmicos. Mais Variáveis que Observações - Regressão de Mínimos Quadrados Parciais.
Metodologia de avaliação
Exame com nota mínima de 7.0 valores + Projeto Computacional.
Componente de Competências Transversais
Pensamento Crítico e Inovador – A realização do projecto possibilita o desenvolvimento dos pensamentos estratégico, compreensivo, crítico e criativo, sem avaliação explícita. Competências Intrapessoais – A realização do projecto permite desenvolver competências sócio emocionais e comportamentais, de trabalho em equipa, produtividade e gestão de tempo, gestão de stress e proatividade, sem avaliação explícita. Competências Interpessoais – Na avaliação do relatório do projecto, 15% da classificação é atribuída à forma do relatório e 10% da classificação é atribuída à apresentação oral e discussão do projecto.
Componente Laboratorial
Realização de trabalhos laboratoriais realizados com auxílio do R (ou equivalente).
Componente de Programação e Computação
Os trabalhos laboratoriais e o projeto envolvem programação em R. A percentagem de avaliação nesta componente é de 50% .
Princípios Éticos
Todos os membros de um grupo são responsáveis pelo trabalho do grupo. Em qualquer avaliação, todo aluno deve divulgar honestamente qualquer ajuda recebida e fontes usadas. Numa avaliação oral, todo aluno deverá ser capaz de apresentar e responder a perguntas sobre toda a avaliação.