diplomsko delo
Metod Zupančič (Avtor), Jure Žabkar (Mentor)

Povzetek

Z razvojem umetne inteligence in strojnega učenja se rešuje veliko vsakdanjih človeških problemov, na področju zvoka navadno predvsem z obravnavanjem človeškega govora. Zaradi vpliva hrupa na človeško zdravje pa je pomembna točka izboljšave kvalitete življenja tudi zaznavanje in minimizacija zvočnega hrupa. Trenutne rešitve se za detekcijo zanašajo samo na nizkonivojsko preseganje dovoljene jakosti, za nadaljnje ukrepe pa potrebujejo višjenivojske informacije o viru zvoka. Pred implementacijo je potrebno pregledati sorodna dela, ključne značilke zvoka in njim najbolj primerne topologije strojnega učenja. Za vir podatkov se bodo uporabljali prostodostopni nabor podatkov, zaželjivo tisti, na katerih je bila že opravljena podobna naloga, ki bi služila za primerjanje rezultatov. Po zadovoljivi uspešnosti izbranih značilk in topologije je potrebno preizkusiti različne načine izboljševanja rezultatov. Pri vseh naborih podatkov se za uporabo konvolucijske nevronske mreže najbolj izkažeta značilki MFCC in MEL z dodajanjem tonsko in časovno spremenjenih zvočnih posnetkov. Glede na sorodna dela, ki so uporabljala enak nabor podatkov, je rešitev te naloge (10-krat prečno preverjena povprečna klasifikacijska natančnost 98,4%) obetavna za nadaljnji razvoj.

Ključne besede

klasifikacija;zvok;visokošolski strokovni študij;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [M. Zupančič]
UDK: 004.85:534.322.3(043.2)
COBISS: 75122691 Povezava se bo odprla v novem oknu
Št. ogledov: 237
Št. prenosov: 60
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Implementation of a machine learning model for the classification of urban sounds
Sekundarni povzetek: With the development of artificial intelligence and machine learning, many everyday human problems are solved, in the field of sound usually mainly by dealing with human speech. Due to the impact of noise on human health, the detection and minimization of sound noise is also an important point for improving the quality of life. Current detection solutions rely only on low-level exceedances of the allowable volume for detection, and require further-level information on the sound source for further action. Prior to implementation, it is necessary to review related works, key sound characteristics and the most appropriate machine learning topologies. Free datasets will be used as the data source, preferably those on which a similar task has already been performed to compare the results. After satisfactory performance of the selected features and configuration of the model, it is necessary to try different ways to improve the results. For the all datasets, the MFCC and MEL features are best used for using a convolutional neural network by adding tone and time augmentations to the audio recordings. According to related works that used the same dataset, the proposed solution to this task (10-fold average classification accuracy 98.4%) is promising for further development.
Sekundarne ključne besede: classification;sound;computer science;computer and information science;diploma;Strojno učenje;Umetna inteligenca;Hrup;Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000470
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 61 str.
ID: 13275175