Dissertação

ETL na era do Big Data EVALUATED

A quantidade de dados existente hoje em dia está a crescer de forma cada vez mais rápida, uma vez que as empresas produzem cada vez mais dados, a velocidades cada vez mais elevadas. Torna-se assim necessária a existência de ferramentas que sejam capazes de lidar com esse volume de dados crescente. A presente dissertação tem como objectivo averiguar em que condições podemos beneficiar da utilização de tecnologias de \textit{Big Data} para o processamento de informação. Numa primeira parte dessa dissertação, serão definidos os principais conceitos relacionados com o processamento de grandes conjuntos de dados, apelidados de \textit{Big Data}, e as tecnologias para processamento destes conjuntos. Serão apresentadas como trabalho relacionado algumas ferramentas para transformação de dados, que incluem algumas das mais utilizadas. A segunda parte da dissertação irá detalhar o trabalho implementado, a sua validação fazendo por fim uma conclusão e análise de trabalho futuro.
Big Data, ETL, MapReduce, Hadoop, Pig.

Junho 28, 2016, 14:30

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Helena Isabel De Jesus Galhardas

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

João Carlos Pereira Damásio

Link Consulting

Investigador Principal