Dissertação

Music Generation Using Generative Adversarial Networks EVALUATED

A ideia de uma máquina ser capaz de gerar música é, de certa forma, intrigante. O processo de composição musical implica a manipulação de sons de base ou notação para criar estruturas mais complexas. Nesta tese é proposto um sistema de geração baseado em formas de onda que representam compassos musicais, tirando partido de técnicas de Machine Learning. Um pré-processamento das amostras de áudio é executado, e consiste na transformação das formas de onda numa representação tempo-frequência, geralmente utilizada para lidar com sinais de música. Um modelo generativo do estado da arte foi implementado com o objectivo de criar trechos idênticos aos do dataset, o qual é composto por compassos com duração de 2 segundos. O modelo original é conhecido como Generative Adversarial Network (GAN), mas a variante implementada beneficia de camadas convolucionais na arquitetura das redes e é chamado Deep Convolutional Generative Adversarial Network. Várias abordagens com diferentes arquiteturas e hiperparâmetros são implementadas de forma a avaliar a capacidade do modelo de cumprir os objectivos propostos. Através de um user study conclui-se que os trechos de música gerados pelo sistema implementado não são ruído, e que são musicalmente agradáveis.
Geração de Música, Generative Adversarial Networks, Deep Learning, Deep Convolutional GAN, Aprendizagem Automática

Junho 12, 2018, 10:0

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Rodrigo Martins de Matos Ventura

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar