Dissertação

{pt_PT=Automatic Geocoding and Dating of Music Based on Audio Content} {} EVALUATED

{pt=Ao longo da história, as trocas culturais têm influenciado a música a evoluir. Estudos anteriores demonstraram que estas trocas culturais estão gravadas na música como informação, possível de ser extraída e aprendida por técnicas automáticas. Neste trabalho, eu trato as tarefas de (i) prever as coordenadas geográficas onde uma música foi feita e (ii) prever o ano de lançamento de uma música. Proponho especificamente uma arquitectura de rede neuronal com dois componentes principais. O primeiro componente são unidades recorrentes, capazes de tratar as propriedades sequenciais da música. A segunda componente é a Atenção Neuronal, um mecanismo que permite focar momentos particulares de uma música, tratando o contexto de um evento musical. Nas minhas experiências uso o Million Song Dataset, uma colecção de descritores de áudio e meta-dados um milhão de músicas populares. A avaliação experimental mostra que o método proposto se comporta relativamente bem na tarefa de prever o ano de lançamento de uma música, e tem uma performance fraca na maior parte dos casos em que se prevê a origem geográfica., en=Throughout history, cultural interchanges have been a driving force for music to evolve. Previous studies have shown that these cultural traces are imprinted in music as information, accessible to be extracted and learned by automatic techniques. In this work, I address the tasks of (i) predicting the geographical coordinates where a song was made and (ii) predicting the release year of songs. I specifically propose a deep neural network architecture with two main components. The first component is recurrent units, capable of leveraging the sequential properties in music. The second component is Neural Attention, a mechanism that allows focusing on particular moments of the song, leveraging the context of a musical moment. In my experiments I use the open-source Million Song Dataset, a collection of audio descriptors and meta-data for a million popular songs. The experimental evaluation shows that the proposed method performs reasonably well in the task of predicting the release year of a song, and has poor performance in most cases for the task of predicting the geographical location}
{pt=Aprendizagem Automática, Redes Neuronais Recorrentes, Geocodifição Automática de Música, Datação Automática de Música, Musicologia, en=Machine Learning, Recurrent Neural Networks, Automatic Geocoding of Mmusic, Automatic Dating of Music, Musicology}

Novembro 2, 2017, 17:45

Publicação

Obra sujeita a Direitos de Autor

Orientação

ORIENTADOR

Bruno Emanuel Da Graça Martins

Departamento de Engenharia Informática (DEI)

Professor Auxiliar

ORIENTADOR

David Manuel Martins de Matos

Departamento de Engenharia Informática (DEI)

Professor Auxiliar