Descrição:
Hoje em dia grandes massas de dados são geradas de diversos modos, a todo o instante em todo o lado: a nossa actividade online, registos médicos, compras, viagens, dados financeiros. Os fluxos de dados produzidos extravasam em muito a actual capacidade de armazenamento a nível mundial e são heterogéneos, ruidosos, incompletos --- e extremamente úteis. Esta unidade curricular tem como objetivo proporcionar ferramentas e abordagens que permitam descobrir as histórias encerradas neste dilúvio de dados. Como o volume de dados é grande, apenas se podem usar algoritmos com complexidade linear; como o volume de dados é pouco estruturado, ruidoso, heterogéneo, é necessário conseguir fundir, completar, estruturar toda a informação subjacente. Vamos trabalhar ferramentas como aprendizagem supervisionada e não supervisionada, aprendizagem online, modelos de low rank, e processamento de sinal em grafos, vamos vê-las a funcionar na prática, culminando no projeto final de big data.