Dissertação

Enhancing locality via caching in the GMU protocol EVALUATED

Os protocolos de replicação parcial possuem um enorme potencial para escalabilidade, no entanto a eficiência destes sistemas pode ser fortemente prejudicada caso os padrões de acesso a dados das aplicações não exibam um bom grau de localidade. Estes sistemas normalmente recorrem a uma função de dispersão consistente para determinar a colocação dos dados, porque estas soluções permitem pesquisas locais muito eficientes e além disso, garantem que a entrada/saída de uma máquina só necessite de uma pequena mudança no mapeamento do sistema. No entanto, devido à natureza aleatória da colocação dos dados (que é independente dos padrões de acesso aos dados), também podem levar a colocações de dados sub-ótimas que prejudicam a localidade. Uma possível solução para melhorar a eficiência destes sistema é o chamado caching, que guarda a informação que é pedida a outras máquinas para que possa ser usada futuramente e evitar novos pedidos. Nesta dissertação, eu proponho um mecanismo de caching para o GMU, um protocolo de replicação parcial genuíno introduzido recentemente. Eu integrei este mecanismo numa plataforma de armazenamento de dados open-source muito popular chamada Infinispan, pertencente à Red Hat. Eu avalio a eficiência e a eficácia da solução apresentada através de uma extensa análise experimental, baseado tanto em ambientes de teste sintéticos como em ambientes de teste conhecidos para este tipo de sistema através da instalação dos mesmos em grandes sistemas públicos de cloud computing. Os resultados mostram que é possível obter performances 14 vezes superiores às actuais.
replicação parcial, função de dispersão consistente, localidade, caching

novembro 8, 2013, 9:0

Documentos da dissertação ainda não disponíveis publicamente

Orientação

ORIENTADOR

Paolo Romano

Departamento de Engenharia Informática (DEI)

Professor Auxiliar