Dissertação

GeoSharding - optimization of data partitioning in sharded georeferenced databases EVALUATED

Actualmente o volume de dados georeferenciados, dados associados a uma posição física, está em contínuo crescimento (como por exemplo, fotografias em redes sociais). As bases de dados NoSQL utilizam o sharding e algoritmos de particionamento para distribuir equilibradamente a informação dos dados e optimizar o acesso aos mesmos. Estes mecanismos dependem da estrutura do sistema de armazenamento para definir os limites dos grupos de dados guardados em cada shard, definindo assim uma espécie de localidade de acesso aos dados. No entanto, alguns destes mecanismos de particionamento e de indexação espacial não são muito eficientes e podem ser optimizados. A estretégia de particionamento desenvolvida e proposta nesta dissertação explora a posição geográfica dos dados para definir um novo mecanismo de sharding, chamado GeoSharding, que utiliza diagramas de Voronoi como estrutura base do mecanismo de indexação espacial. O objectivo principal do trabalho realizado foi definir um algoritmo para simular a política do GeoSharding e demonstrar como este pode optimizar o particionamento de dados georeferenciados utilizando um sistema de base de dados NoSQL. Os resultados obtidos mostram que este método pode optimizar o particionamento da informação em relação ao desempenho das queries espaciais, do equilíbrio de carga nos nós do sistema e da replicação de dados em sistemas que armazenam informação espacial.
Sharding, Dados Georeferenciados, Big Data, NoSQL

Novembro 25, 2016, 15:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Laura Lonza Ricci

ORIENTADOR

João Nuno De Oliveira e Silva

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar