Programa

Planeamento, Aprendizagem e Decisão Inteligente

Mestrado Bolonha em Engenharia e Ciência de Dados

Mestrado Bolonha em Engenharia Informática e de Computadores - Taguspark

Mestrado Bolonha em Engenharia Informática e de Computadores - Alameda

Minor em Robótica e Sistemas Inteligentes

Programa

Parte I. Introdução 1. Probabilidades. Optimização. 2. Cadeias de Markov. Estabilidade estocástica. 3. HMM. Os algoritmos forward-backward e Viterbi. Parte II. Decisão face à incerteza 4. Utilidade esperada. Teoria da decisão e optimização. 5. MDPs. Valor de estado e de estado-acção. Optimalidade. Os algoritmos de value iteration e policy iteration. 6. POMDPs. Beliefs. Planeamento em POMDPs. Parte III. Aprendizagem 7. Aprendizagem supervisionada (revisão). Aprendizagem activa. Aprendizagem por reforço inversa. 8. Aprendizagem por reforço (RL). . RL baseada em modelos. . RL baseada em valor: os algoritmos TD, Q-learning e SARSA. . RL baseada em políticas: policy-gradient e arquitectura actor-crítico. 9. Predição sequencial. Os algoritmos Weighted majority e EWA. Multi-armed bandits.