Disciplina Curricular

Programação para Ciência de Dados PCDad

Minor em Informática - Min-I 2021

Contextos

Grupo: Min-I 2021

Período:

Peso

6.0 (para cálculo da média)

Pré-requisitos

Noções básicas de probabilidades e estatística

Objectivos

Os estudantes devem ser capazes de : 1. Perceber os conceitos fundamentais de base de dados, do ponto de vista do utilizador: manipular e extrair dados de uma base de dados. 2. Perceber as vantagens e características particulares de uma Data Warehouse: saber explorar cubos de dados através de interrogações OLAP, e aplicar as agregações necessárias à análise de dados. 3. Saber aplicar as técnicas básicas de descoberta de informação em dados tabulares, em particular de classificação, e avaliar os diferentes modelos descobertos. 4. Ser hábil a manipular as bibliotecas e ferramentas mais comuns de análise e ciência de dados, em particular as baseadas em Python

Programa

1. Fundamentos de programação orientada por objetos em Python 2. Bases de dados relacionais: o modelo relacional e o acesso aos dados com SQL 3. Data warehousing: modelo em estrela e cubos de dados; linguagens para manipulação de cubos 4. Exploração e princípios de visualização de dadoss 5. Seleção e preparação de dados: o processo ETL e integração de dados 6. Classificação: treino modelos de classificação (naïve Bayes, KNN, árvores de decisão e random forests). Avaliação de modelos, estimação de desempenho e overfitting. Redes neuronais e deep learning.

Metodologia de avaliação

A nota final é baseada em três componentes: E: exame, P: projeto e L: laboratórios (opcional) A nota final é dada por 50%E + max(10%L + 40%P, 50%P), sujeita a: E>=9.5 e P>=9.5 Avaliação oral quando P-E>=4

Componente de Competências Transversais

Em termos de Competências Interpessoais e Literacia da Informação e dos Media, o curso endereça os tópicos de Comunicação Escrita e de Estruturação e Formação de Relatórios, respetivamente, através da avaliação do relatório produzido no âmbito do projeto (~1% NF). Em concreto, os tópicos de descrição de dados e de visualização de informação, versam em detalhe os elementos e formas mais adequadas de apresentação da informação sob a forma escrita, também avaliadas em exame (~1.5% NF). Quanto a Competências Intrapessoais, são tratados os aspetos relacionados com a Produtividade e Gestão do Tempo (definição do planeamento do projeto e respetiva verificação) e de Tomada de Decisão (discussão das decisões tomadas no projeto, e pela justificação face às alternativas ~2.5% NF).

Componente Laboratorial

Os laboratórios apresentam um conjunto de tarefas, desde pequenos exercícios de programação até à execução de queries e análise de dados. Os alunos devem apresentar os resultados a que chegarem para cada tarefa, de acordo com o planeamento das aulas.

Componente de Programação e Computação

na

Princípios Éticos

Todos os membros de um grupo são responsáveis pelo trabalho do grupo. Em qualquer avaliação, todo aluno deve divulgar honestamente qualquer ajuda recebida e fontes usadas. Numa avaliação oral, todo aluno deverá ser capaz de apresentar e responder a perguntas sobre toda a avaliação.

Disciplinas Execução

2022/2023 - 2º semestre

2021/2022 - 1º Semestre