magistrsko delo
Jure Kučer (Avtor), Peter Kokol (Mentor)

Povzetek

Razširjenost trenda masovnega hranjenja podatkov na različnih področjih znanosti omogoča vse naprednejšo uporabo metod strojnega učenja za iskanje novega znanja. Magistrsko delo zajema predstavitev osnovnih konceptov in tehnik za obdelavo podatkov, obravnavo manjkajočih vrednosti in končno uporabo pri učenju popularnejših algoritmov strojnega učenja z namenom klasifikacije laboratorijskih meritev pacientov. Primerjani sta uspešnost klasifikacijskih modelov naivni Bayes, k-najbližjih sosedov, odločitveno drevo, metoda podpornih vektorjev, naključni gozd, nevronska mreža, Adaboost in Adabagg ter vpliv metod podvzorčenja, nadvzorčenja in SMOTE za balansiranje učnih podatkov. Implementiran je tudi grafični vmesnik za vnos meritev, klasifikacijo, pregled rezultatov in pomembnosti lastnosti.

Ključne besede

strojno učenje;diagnoza bolezni;klasifikacija;diabetes;magistrske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.09 - Magistrsko delo
Organizacija: UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Založnik: [J. Kučer]
UDK: 004.85:616-071(043.2)
COBISS: 47997187 Povezava se bo odprla v novem oknu
Št. ogledov: 395
Št. prenosov: 54
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Machine learning for more efficient disease diagnosis
Sekundarni povzetek: The spreading trend of storing data in multiple scientific fields has enabled more advanced methods of machine learning to be used in search of new knowledge. An overview of basic concepts and techniques for data preparation, handling of missing values and usage in the learning process of some more popular machine learning algorithms for patient lab result classification is presented. Comparison of naive Bayes, k-Nearest neighbour, decision tree, support vector machine, random forest, Adaboost and Adabagg machine learning models on oversampled, undersampled and SMOTE balanced dataset accuracy is made. An implementation of a user interface for data input, classification, result and feature importance overview is included.
Sekundarne ključne besede: machine learning;disease diagnosis;classification;diabetes;
Vrsta dela (COBISS): Magistrsko delo/naloga
Komentar na gradivo: Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Računalništvo in informacijske tehnologije
Strani: IX, 73 f.
ID: 12149858