Programa

Sistemas Distribuídos Tolerantes a Faltas

Mestrado Bolonha em Engenharia Informática e de Computadores - Alameda

Programa

A fiabilidade e disponibilidade são hoje atributos fundamentais a ter em conta na concepção, concretização e instalação de sistemas distribuídos. No entanto, é surpreendentemente difícil assegurar a cooperação robusta entre processos quando estes podem falhar. Para permitir que o arquitecto de sistema domine esta complexidade, o curso introduz um conjunto de abstracções fundamentais para o suporte ao desenvolvimento de aplicações distribuídas confiáveis e descreve os algoritmos que as concretizam. Nomeadamente, abordam-se os seguintes temas: Abstracções básicas: processos, elos, detectores de falhas. Difusão fiável: difusão melhor-esforço, regular, uniforme, probabilista e causal. Memória partilhada: registos regulares e registos atómicos. Consenso distribuído. Variantes do consenso: difusão totalmente ordenada, difusão com terminação, confirmação atómica, filiação em grupo, sincronia na vista. A moldura de comunicação em grupo Appia. Durante o curso, os alunos irão também desenvolver um projecto que lhes permitirá aplicar estas abstracções na prática.