diplomsko delo
Domen Mohorčič (Avtor), Igor Kononenko (Mentor), Matevž Pesek (Komentor)

Povzetek

V diplomski nalogi obravnavamo problem avtomatske transkripcije glasbe z uporabo globokih nevronskih mrež, natančneje s konvolucijskimi nevronskimi mrežami. Avtomatska transkripcija glasbe je postopek zapisa not iz poslušanja glasbenega posnetka. Preučili smo dosedanje pristope in ugotovili pomanjkanje raziskav o velikosti in o obliki posameznih arhitektur globokih modelov. Raziskali smo uspešnost štirih različnih arhitektur konvolucijskih nevronskih mrež na zbirki klavirskih posnetkov MAPS, ki je pogosta izbira za učenje avtomatske transkripcije glasbe. Preučili smo tudi dva različna pristopa normalizacije spektrogramov: standardizacijo in logaritemsko kompresijo. Izkazalo se je, da na uspešnost transkripcije pozitivno vpliva večje število konvolucijskih plasti v nevronski mreži. Prav tako je bila transkripcija na logaritemsko kompresiranih spektrogramih za 10 \% uspešnejša od transkripcije na standardiziranih spektrogramih.

Ključne besede

avtomatska transkripcija glasbe;konvolucijska nevronska mreža;klavirska glasba;transformacija s konstantnim Q;logaritemska kompresija;računalništvo in informatika;univerzitetni študij;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [D. Mohorčič]
UDK: 004.8:786/789(043.2)
COBISS: 76612099 Povezava se bo odprla v novem oknu
Št. ogledov: 268
Št. prenosov: 26
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Automatic music transcription of piano music with convolutional neural networks
Sekundarni povzetek: In this thesis we explore the problem of automatic music transcription using deep neural networks, more specific convolutional neural networks. Automatic music transcription is a task of writing the sheet music from musical recordings. We analysed previous studies and found that there was a lack of research about the size and the shape of architecture of deep models. We explored the performance of four different architectures of convolutional neural networks on the piano recordings dataset MAPS, which is a common benchmark for learning automatic music transcription. We also compared two different normalization techniques for spectrograms: standardization and the logarithmic compression. We found out that the performance of transcription is highly correlated with the higher number of convolutional layers. Transcription is also 10\% more successful with logarithmic compression instead of standardization.
Sekundarne ključne besede: automatic music transcription;convolutional neural network;piano music;constant Q transform;logarithmic compression;computer science;computer and information science;diploma;Umetna inteligenca;Klavirska glasba;Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000468
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 48 str.
ID: 13342312