diplomsko delo
Tadej Lahovnik (Avtor), Vili Podgorelec (Mentor)

Povzetek

V diplomskem delu smo se poglobili v izdelavo različnih tipov spektrogramov in klasifikacijo slik z uporabo konvolucijskih nevronskih mrež. Zanimalo nas je, ali je možno zanesljivo napovedati žanr zvočnega posnetka glede na spektrogram, ki mu pripada. Tekom razvoja smo ustvarili tri različne tipe spektrogramov. Za vsak tip smo ustvarili ločen klasifikacijski model, nato pa smo iz vseh treh modelov sestavili klasifikacijski ansambel. Tako smo dobili najbolj zanesljive rezultate. Klasifikacijo smo nato ovrednotili s številnimi metrikami, kjer nas je najbolj zanimala sama točnost klasifikacije. Iz matrike zmede smo izčrpali najpogostejše napake pri klasifikaciji.

Ključne besede

klasifikacija;spektrogram;strojno učenje;nevronske mreže;glasbeni žanri;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Založnik: [T. Lahovnik]
UDK: 004.85:004.932(043.2)
COBISS: 130638083 Povezava se bo odprla v novem oknu
Št. ogledov: 57
Št. prenosov: 12
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Music genre classification based on the spectrogram of the sound recording
Sekundarni povzetek: In our thesis, we delved into the generation of diverse types of spectrograms and image classification using convolutional neural networks. We were interested in whether it is possible to reliably predict the genre of an audio recording based on its spectrogram. During our development, we created three distinct types of spectrograms. We created a separate classifier model for each type and then built a classifier ensemble from all three models. In this way, we obtained the most reliable results. We then evaluated the classification with several metrics, where we were most interested in the accuracy of the classification. We extracted the most common classification errors from the confusion matrix.
Sekundarne ključne besede: classification;spectrogram;machine learning;neural networks;music genre;
Vrsta dela (COBISS): Diplomsko delo/naloga
Komentar na gradivo: Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Informatika in tehnologije komuniciranja
Strani: 1 spletni vir (1 datoteka PDF (X, 36 f.))
ID: 16193677