Disciplina Curricular

Planeamento, Aprendizagem e Decisão Inteligente ADI

Mestrado Bolonha em Engenharia Informática e de Computadores - Taguspark - MEIC-T 2021

Contextos

Grupo: MEIC-T 2021 > 2º Ciclo > Área Principal > Agrupamentos > Robótica Inteligente

Período:

Grupo: MEIC-T 2021 > 2º Ciclo > Área Principal > Agrupamentos > Inteligência Artificial

Período:

Peso

6.0 (para cálculo da média)

Objectivos

Espera-se que, após a frequência da cadeira, os alunos sejam capazes de: 1. Reconhecer os principais desafios envolvidos no desenvolvimento de sistemas inteligentes em cenários com incerteza; 2. Conhecer e aplicar as principais técnicas de planeamento e aprendizagem neste tipo de cenários.

Programa

Parte I. Introdução 1. Probabilidades. Optimização. 2. Cadeias de Markov. Estabilidade estocástica. 3. HMM. Os algoritmos forward-backward e Viterbi. Parte II. Decisão face à incerteza 4. Utilidade esperada. Teoria da decisão e optimização. 5. MDPs. Valor de estado e de estado-acção. Optimalidade. Os algoritmos de value iteration e policy iteration. 6. POMDPs. Beliefs. Planeamento em POMDPs. Parte III. Aprendizagem 7. Aprendizagem supervisionada (revisão). Aprendizagem activa. Aprendizagem por reforço inversa. 8. Aprendizagem por reforço (RL). . RL baseada em modelos. . RL baseada em valor: os algoritmos TD, Q-learning e SARSA. . RL baseada em políticas: policy-gradient e arquitectura actor-crítico. 9. Predição sequencial. Os algoritmos Weighted majority e EWA. Multi-armed bandits.

Metodologia de avaliação

A avaliação inclui duas componentes: . Uma componente teórica, avaliada através de uma prova escrita individual, e que corresponde a 50% da nota final; . Uma componente laboratorial, através da realização de trabalhos de laboratório em grupos de 2, e que corresponde a 50% da nota final.

Disciplinas Execução