magistrsko delo
Povzetek
Razširjenost trenda masovnega hranjenja podatkov na različnih področjih znanosti omogoča vse naprednejšo uporabo metod strojnega učenja za iskanje novega znanja. Magistrsko delo zajema predstavitev osnovnih konceptov in tehnik za obdelavo podatkov, obravnavo manjkajočih vrednosti in končno uporabo pri učenju popularnejših algoritmov strojnega učenja z namenom klasifikacije laboratorijskih meritev pacientov. Primerjani sta uspešnost klasifikacijskih modelov naivni Bayes,
k-najbližjih sosedov, odločitveno drevo, metoda podpornih vektorjev, naključni gozd, nevronska mreža, Adaboost in Adabagg ter vpliv metod podvzorčenja, nadvzorčenja in SMOTE za balansiranje učnih podatkov. Implementiran je tudi grafični vmesnik za vnos meritev, klasifikacijo, pregled rezultatov in pomembnosti lastnosti.
Ključne besede
strojno učenje;diagnoza bolezni;klasifikacija;diabetes;magistrske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2020 |
Tipologija: |
2.09 - Magistrsko delo |
Organizacija: |
UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko |
Založnik: |
[J. Kučer] |
UDK: |
004.85:616-071(043.2) |
COBISS: |
47997187
|
Št. ogledov: |
395 |
Št. prenosov: |
54 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Machine learning for more efficient disease diagnosis |
Sekundarni povzetek: |
The spreading trend of storing data in multiple scientific fields has enabled more advanced methods of machine learning to be used in search of new knowledge. An overview of basic concepts and techniques for data preparation, handling of missing values and usage in the learning process of some more popular machine learning algorithms for patient lab result classification is presented. Comparison of naive Bayes, k-Nearest neighbour, decision tree, support vector machine, random forest, Adaboost and Adabagg machine learning models on oversampled, undersampled and SMOTE balanced dataset accuracy is made. An implementation of a user interface for data input, classification, result and feature importance overview is included. |
Sekundarne ključne besede: |
machine learning;disease diagnosis;classification;diabetes; |
Vrsta dela (COBISS): |
Magistrsko delo/naloga |
Komentar na gradivo: |
Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Računalništvo in informacijske tehnologije |
Strani: |
IX, 73 f. |
ID: |
12149858 |