magistrsko delo
Abstract
Razširjenost trenda masovnega hranjenja podatkov na različnih področjih znanosti omogoča vse naprednejšo uporabo metod strojnega učenja za iskanje novega znanja. Magistrsko delo zajema predstavitev osnovnih konceptov in tehnik za obdelavo podatkov, obravnavo manjkajočih vrednosti in končno uporabo pri učenju popularnejših algoritmov strojnega učenja z namenom klasifikacije laboratorijskih meritev pacientov. Primerjani sta uspešnost klasifikacijskih modelov naivni Bayes,
k-najbližjih sosedov, odločitveno drevo, metoda podpornih vektorjev, naključni gozd, nevronska mreža, Adaboost in Adabagg ter vpliv metod podvzorčenja, nadvzorčenja in SMOTE za balansiranje učnih podatkov. Implementiran je tudi grafični vmesnik za vnos meritev, klasifikacijo, pregled rezultatov in pomembnosti lastnosti.
Keywords
strojno učenje;diagnoza bolezni;klasifikacija;diabetes;magistrske naloge;
Data
Language: |
Slovenian |
Year of publishing: |
2020 |
Typology: |
2.09 - Master's Thesis |
Organization: |
UM FERI - Faculty of Electrical Engineering and Computer Science |
Publisher: |
[J. Kučer] |
UDC: |
004.85:616-071(043.2) |
COBISS: |
47997187
|
Views: |
395 |
Downloads: |
54 |
Average score: |
0 (0 votes) |
Metadata: |
|
Other data
Secondary language: |
English |
Secondary title: |
Machine learning for more efficient disease diagnosis |
Secondary abstract: |
The spreading trend of storing data in multiple scientific fields has enabled more advanced methods of machine learning to be used in search of new knowledge. An overview of basic concepts and techniques for data preparation, handling of missing values and usage in the learning process of some more popular machine learning algorithms for patient lab result classification is presented. Comparison of naive Bayes, k-Nearest neighbour, decision tree, support vector machine, random forest, Adaboost and Adabagg machine learning models on oversampled, undersampled and SMOTE balanced dataset accuracy is made. An implementation of a user interface for data input, classification, result and feature importance overview is included. |
Secondary keywords: |
machine learning;disease diagnosis;classification;diabetes; |
Type (COBISS): |
Master's thesis/paper |
Thesis comment: |
Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Računalništvo in informacijske tehnologije |
Pages: |
IX, 73 f. |
ID: |
12149858 |