Disciplina Curricular

Ciência de Dados CDadosi

Mestrado Bolonha em Engenharia Informática e de Computadores - Alameda - MEIC-A 2021

Contextos

Grupo: MEIC-A 2021 > 2º Ciclo > Area Principal > Agrupamentos > Sistemas de Informação

Período:

Grupo: MEIC-A 2021 > 2º Ciclo > Area Principal > Agrupamentos > Sistemas Ciberfísicos

Período:

Grupo: MEIC-A 2021 > 2º Ciclo > Area Principal > Agrupamentos > Inteligência Artificial

Período:

Grupo: MEIC-A 2021 > 2º Ciclo > Area Principal > Agrupamentos > Engenharia e Ciência de Dados

Período:

Grupo: MEIC-A 2021 > 2º Ciclo > Area Principal > Agrupamentos > Bioinformática e Biologia Computacional

Período:

Peso

6.0 (para cálculo da média)

Pré-requisitos

Os estudantes devem ser proeficientes em programação e dominar os conceitos básicos de probabilidades e estatística.

Objectivos

Os estudantes devem ser capazes de compreender e aplicar o processo de descoberta de informação a dados tabulares e temporais, em todas as suas etapas. Em particular: 1. na exploração de dados através das técnicas básicas de descrição e visualização, 2. na aplicação de técnicas de aprendizagem de modelos de classificação, segmentação e descoberta de padrões, 3. na escolha das abordagens mais adequadas de preparação de dados de modo a melhorar o desempenho das técnicas de aprendizagem de modelos, 4. na avaliação do desempenho dos modelos e no reconhecimento do impacto de cada escolha efetuada. Ortogonalmente, os estudantes deve ser capazes de: 1. Compreender os desafios subjacentes à descoberta de informação em dados complexos e de grande escala, 2. Identificar dados sensíveis e que possam estar sujeitos a restrições de processamento, nomeadamente anonimização, de modo a garantir a preservação da privacidade da entidades.

Programa

1. Ciência de Dados e o processo de descoberta de informação. Avaliação de desempenho: métricas, estratégias, estimação e o princípio da navalha de Occam. 2. Descrição dos dados e princípios de visualização de informação. 3. Preparação de dados: normalização, redução balanceamento. Valores omissos. Engenharia de variáveis. 4. Classificação: cinco tribos. Combinação de modelos. Sobre-aprendizagem. 5. Regressão: linear, logística e não-paramétrica 6. Prospeção de Padrões: regras de associação e padrões sequenciais. 7. Segmentação: algoritmo hierárquicos e baseados em modelos, densidade ou partição. Biclustering. 8. Deteção de anomalias 9. Análise de dados temporais. Preparação, modelação e previsão de séries temporais. 10. Introdução à análise de redes sociais. 11. Descoberta de informação em dados complexos: espacio-temporais, relacionais e multi-dimensionais. 12. Descoberta de informação em dados em grande escala. 13. Implicações Éticas Legais e Sociais dos dados.

Metodologia de avaliação

A nota final é baseada em três componentes: E: exame, P: projeto e L: laboratórios (opcional) A nota final é dada por 50%E + max(10%L + 40%P, 50%P), sujeita a: E>=9.5 e P>=9.5 Avaliação oral quando P-E>=4

Componente de Competências Transversais

O curso endereça as Competências de Cidadania Global, no que diz respeito à Ética e Deontologia Profissional, em que as preocupações éticas inerentes ao processo de descoberta de informação são abordadas, e o GDPR é apresentado (avaliado em exame - 1.5% NF). Em termos de Competências Interpessoais e Literacia da Informação e dos Media, o curso endereça os tópicos de Comunicação Escrita e de Estruturação e Formação de Relatórios, respetivamente, através da avaliação do relatório do projeto (1% NF). Em concreto, os tópicos de descrição de dados e visualização de informação, endereçam os elementos e formas mais adequadas de apresentação da informação sob a forma escrita (avaliado em exame 1.5% NF). Quanto a Competências Intrapessoais, são tratados os aspetos relacionados com a Produtividade e Gestão do Tempo (definição do planeamento do projeto e respetiva verificação) e de Tomada de Decisão: discussão das decisões tomadas no projeto, e pela justificação face às alternativas 2.5%NF.

Componente Laboratorial

Os laboratórios apresentam um conjunto de tarefas de análise: descrição de dados, classificação Bayesiana e baseada em instâncias, classificação com árvores e combinação de modelos, descoberta de padrões, segmentação e regressão, entre outras. Os alunos (em grupos de 3) devem mostrar gráficos resumidos sobre a análise realizada para cada tarefa, de acordo com um planeamente previamente apresentado pelo grupo.

Componente de Programação e Computação

N/A

Princípios Éticos

Todos os membros de um grupo são responsáveis pelo trabalho do grupo. Em qualquer avaliação, todo aluno deve divulgar honestamente qualquer ajuda recebida e fontes usadas. Numa avaliação oral, todo aluno deverá ser capaz de apresentar e responder a perguntas sobre toda a avaliação.

Disciplinas Execução

2023/2024 - 1º semestre

2022/2023 - 1º semestre

2021/2022 - 1º Semestre