Dissertação

{en_GB=Music Generation Using Generative Adversarial Networks} {} EVALUATED

{pt=A ideia de uma máquina ser capaz de gerar música é, de certa forma, intrigante. O processo de composição musical implica a manipulação de sons de base ou notação para criar estruturas mais complexas. Nesta tese é proposto um sistema de geração baseado em formas de onda que representam compassos musicais, tirando partido de técnicas de Machine Learning. Um pré-processamento das amostras de áudio é executado, e consiste na transformação das formas de onda numa representação tempo-frequência, geralmente utilizada para lidar com sinais de música. Um modelo generativo do estado da arte foi implementado com o objectivo de criar trechos idênticos aos do dataset, o qual é composto por compassos com duração de 2 segundos. O modelo original é conhecido como Generative Adversarial Network (GAN), mas a variante implementada beneficia de camadas convolucionais na arquitetura das redes e é chamado Deep Convolutional Generative Adversarial Network. Várias abordagens com diferentes arquiteturas e hiperparâmetros são implementadas de forma a avaliar a capacidade do modelo de cumprir os objectivos propostos. Através de um user study conclui-se que os trechos de música gerados pelo sistema implementado não são ruído, e que são musicalmente agradáveis., en=The idea of a machine being able to generate music is somehow intriguing. The music composition process implies the manipulation of baseline sounds or notation to create more complex structures. In this thesis a generation system based on raw waveforms representing musical bars is proposed, taking advantage of Machine Learning techniques. A preprocessing of the audio samples is performed, consisting on a transformation of the waveforms into a time-frequency representation, commonly used to deal with music signals. A state-of-the-art generative model was implemented with the purpose of creating music segments similar to those in the dataset, which is composed by 2 second long music bars. The original model is known Generative Adversarial Network (GAN) but the approached variant benefits from convolutional layers in its network’s architecture and is called Deep Convolutional Generative Adversarial Network. Several approaches were made regarding different architectures and hyperparameters, in order to evaluate the model's capability of meeting the proposed objectives. By means of an user study it is concluded that the music segments generated by the implemented system are not noise, and are actually musically pleasing.}
{pt=Geração de Música, Generative Adversarial Networks, Deep Learning, Deep Convolutional GAN, Aprendizagem Automática, en=Music Generation, Generative Adversarial Networks, Deep Learning, Deep Convolutional GAN, Machine Learning}

Junho 12, 2018, 10:0

Orientação

ORIENTADOR

Rodrigo Martins de Matos Ventura

Departamento de Engenharia Electrotécnica e de Computadores (DEEC)

Professor Auxiliar