Planeamento

Aulas Teóricas

AT 1 - Sistemas de Apoio à Decisão

Apresentação. Motivação e funcionamento da disciplina.

Data Science. O processo KDD. Pre-processamento.

AT 2 - Regras de Associação

Regras de Associação - o algoritmo Apriori. Avaliação. Métodos de discretização.

AT 3 - Descoberta de Padrões

Outras abordagens de descoberta de padrões.

Descoberta de padrões sequenciais.

AT 4 - Segmentação

Definição de segmentação. Algoritmo k-means. Avaliação. Standardização e medidas de semelhança.

AT 5 - Segmentação

Algoritmo EM.

Normalização e redução. Análise de Componentes Principais (PCA).

AT 6 - Classificação

Definição de classificação. Noção de conceito. O algoritmo dos k-vizinhos mais próximos.

Medidas de avaliação: precisão. Estratégias de treino.

AT 7 - Classificação Bayesiana

Classificador de máximo à posteriori. Naive Bayes.

Avaliação de classificadores: ROC charts e outras medidas de precisão.

AT 8 - Árvores de decisão

Árvores de decisão - definição. Os algoritmos ID3 e C4.5.

AT 9 - Árvores de decisão

O algoritmo CART. Overfitting. Princípio da navalha de Occam. Princípio das descrições mais compactas.

AT 10 - Redução de dados e Balanceamento

Redução de dados: análise dos componentes principais e seleção de atributos.

Balanceamento: SMOTE

AT 13 - Redes neuronais

Perceptrão. Algoritmo do gradiente ascendente.

AT 12 - Redes neuronais

Redes multicamada. O algoritmo backpropagation.

AT 13 - SVMs

Máquinas de vectores de suporte. O hiperplano de margem máxima. Kernels.

AT 14 - SVMs

Classificador de margem suave.

Algoritmo SMO.

AT 15 - Redes de Bayes

Redes de Bayes - definição. Treino com o algoritmo do gradiente ascendente.

AT 16 - Redes de Bayes

Treino de redes de Bayes com o algoritmo EM.

AT 17 - Combinação de modelos

Conceitos básicos. Bagging e Random Forests. Boosting. O algoritmo AdaBoost.

AT 18 - Regressão Linear e Logística

Regressão Linear.

Regressão Logística.

AT 19 - Redes sociais

Análise de redes sociais: definições e propriedades.

AT 20 - Redes sociais

Os algoritmos HITS e PageRank.

AT 21 - Análise Temporal

Análise de séries temporais.

AT 22 - Análise de texto

Representação de texto. Análise de texto. Análise de opiniões.

AT 23 - Big Data and Deep Learning

Desafios associados ao Big Data.

Avanços na arquitetura e treino de redes neuronais.

AT 24 - Notas de encerramento

Próximos desafios da Análise de Dados.

Conclusão.

Aulas Laboratoriais

Inscrições

 Inscrição de grupos (no Fénix).

Lab 1 - Association rules

Mining association rules. Exploring support, confidence, lift and conviction.

Lab 2 - Clustering.

Clustering algorithms. Standardization and PCA. Evaluation.

Lab - Projeto

Apoio ao projeto.

Lab 3 - Classificação

Weka - classificação com KNN. Estratégias de treino e avaliação. Dados não balanceados.

Lab 6 - Redes Neuronais

Treino de redes neuronais: perceptrões multi-camada .

Project

Project support.

AP 1 - Classificação: árvores de decisão

Exercícios: KNN e árvores de decisão.

AP 2 - Classificação: redes neuronais

Exercícios: redes neuronais e regras de associação.

AP3 - Classificação Bayesiana

Exercícios de naive Bayes e redes de Bayes.

AP 4 - Ensemble and ARs

Exercises: ensemble methods and association rules.

AP4 - Redes Sociais e SVMs

PageRank and SMO exercises.