Disciplina

Área

Área Científica de Inteligência Artificial > Sistemas Inteligentes

Activa nos planos curriculares

MEIC-T 2015 > MEIC-T 2015 > 2º Ciclo > Agrupamentos > Bioinformática e Biologia Computacional > Sistemas de Apoio à Decisão

MEIC-A 2015 > MEIC-A 2015 > 2º Ciclo > Agrupamentos > Bioinformática e Biologia Computacional > Sistemas de Apoio à Decisão

MEBiom 2006 > MEBiom 2006 > 2º Ciclo > Opções > Opção 2 > Sistemas de Apoio à Decisão

MERC 2006 > MERC 2006 > 2º Ciclo > Opções > Sistemas de Apoio à Decisão

MEIC-T 2006 > MEIC-T 2006 > 2º Ciclo > Áreas de Especialização Complementares > Sistemas de Informação Empresariais > Sistemas de Apoio à Decisão

MEIC-A 2006 > MEIC-A 2006 > 2º Ciclo > Área de Especialização Complementar > Sistemas de Informação Empresariais > Sistemas de Apoio à Decisão

Nível

A avaliação é composta por 2 componentes: • NP = nota do parte prática (projeto ou laboratórios) • NE = nota do exame A nota final (NF) é dada por: NF = 30% NP + 70% NE Observações: A nota mínima no projeto e exame é 9.0 valores.

Tipo

Não Estruturante

Regime

Semestral

Carga Horária

1º Semestre

3.0 h/semana

1.5 h/semana

147.0 h/semestre

Objectivos

Introduzir os conceitos fundamentais da descoberta de informação a partir de grandes quantidades de dados Tornar os alunos hábeis na criação de sistemas capazes de descobrir informação escondida através da aplicação de técnicas de data mining. Tornar os alunos hábeis na avaliação da informação descoberta, em particular na comparação dos diferentes modelos descobertos.

Programa

Introdução. (1.5 h – 1 aula) Processo de Descoberta de Informação Pré-processamento (3 h – 2 aulas) Seleção, Limpeza, Integração e Redução PCA Pós-processamento (1.5h - 1 aula) Avaliação. Princípio da navalha de Occam e MDL Regras de associação e descoberta de padrões (3h – 2 aulas) Algoritmos apriori. Regras de associação, padrões máximos e fechados Descoberta de padrões sequenciais– PrefixSpan Segmentação (Clustering) (3h – 2 aulas) Algoritmos k-means e em Segmentação de sequências Classificação Noção de conceito (0.5 h) Classificação baseada em instâncias – knn (0.5 h) Classificação Bayesiana – MAP, naïve Bayes, Redes de Bayes (3h – 2 aulas) Árvores de decisão – ID3, C4.5 e CART (3 h – 2 aulas) Redes neuronais – treino perceptrão e backpropagation (3h – 2 aulas) Máquinas de vectores de suporte (3 h – 2aulas) Combinação de modelos (Ensemble) – RandomForests, AdaBoost (3 h – 2 aulas) Avaliação de modelos (1.5 h – 1 aula) Social Network Analysis (3h - 2 aulas) Conceitos básicos: centralidade e prestígio. Algoritmo HITS Algoritmo PageRank e variantes Aplicações (9 h – 6 aulas) Descoberta de informação em fluxos de dados e “na nuvem” Sistemas de recomendação Exploração de texto e recuperação da informação Bioinformática e exploração de dados clínicos Análise de séries temporais e exploração de dados temporais Descoberta de sentimentos e exploração de opiniões

Metodologia de avaliação

A avaliação é composta por 2 componentes: • NP = nota do parte prática (projeto ou laboratórios) • NE = nota do exame A nota final (NF) é dada por: NF = 30% NP + 70% NE Observações: A nota mínima no projeto e exame é 9.0 valores.

Bibliografia

Principal

Data Mining : Concepts and Techniques, 3rd edition

Jiawei Han and Micheline Kamber

2011

Morgan Kaufman Publishers


Web Mining, 2nd edition

Bing Liu

2011

Springer


Machine Learning

Tom M. Mitchell

1997

Mc Graw Hill


Artificial Intelligence: A Modern Approach, 3rd edition

Stuart Russell and Peter Norvig

2010

Prentice Hall


Neural Networks and Learning Machines

Simon S. Haykin

2009

Prentice Hall