bachelor's thesis

Povzetek

This thesis explores application of machine learning methods for classification of patients with Parkinson's disease (PD) to improve accuracy over current methods. Our aim is to present a generalised algorithm for disease progression analysis from time series data that can be applied to arbitrary data of this format. We used clinical time series data based on Parkinson's Progression Markers Initiative (PPMI) questionnaires. After normalizing and celeaning the data using modern data mining techniques, we used unsupervised clustering to identify patients' disease subtypes. After assigning the initial subtype membership to the patients' baseline visits, we tested and used the best performing supervised learning model to predict patients' disease severity for the remaining visits. For this task, we applied the support vector machine (SVM), multilayer perceptron (MLP) and random forest (RF). SVM proved to be the best solution for our problem with an accuracy of 95.06% on the test set. Finally, we model and observe patients' disease subtype changes between their consecutive visits using skip-grams and markov chains. This thesis provides a rigorous analysis of advanced machine learning techniques on time series data.

Ključne besede

Parkinson's disease;cognitive diseases;machine learning;artificial inteligence;time-series;clustering;computer and information science;diploma thesis;

Podatki

Jezik: Angleški jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [J. T. Udovič]
UDK: 004.8:616.858(043.2)
COBISS: 147547139 Povezava se bo odprla v novem oknu
Št. ogledov: 68
Št. prenosov: 17
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Slovenski jezik
Sekundarni naslov: Analiza podatkov o kognitivnih boleznih z metodami strojnega učenja
Sekundarni povzetek: V diplomski nalogi obravnavamo uporabo metod strojnega učenja za uvrščanje bolnikov s Parkinsonovo boleznijo (PD) s ciljem izboljšanja točnosti glede na trenutno metodo. Cilj naloge je predstaviti posplošen algoritem za analizo napredovanja bolezni iz podatkov časovne vrste, ki ga je mogoče uporabiti za poljubne podatke tega formata. Pri analizi smo uporabljali klinične časovne vrste podatkov, ki temeljijo na vprašalnikih Parkinson's Progression Markers Initiative (PPMI). Po čiščenju in normalizaciji podatkov smo uporabili nenadzorovano gručenje za prepoznavanje podtipov bolezni bolnikov. Po določitvi začetnega podtipa bolezni za prve obiske bolnikov pri zdravniku smo preizkusili in uporabili najboljši model nadzorovanega učenja za napoved stopnje bolezni preostalih obiskov. Za ta namen smo uporabili različne klasifikatorje: metodo podpornih vektorjev (SVM), večplastni perceptron (MLP) in naključne gozdove (RF). Metoda SVM se je izkazala kot najboljša za naš problem s točnostjo 95,06% na testnih podatkih. Na koncu modeliramo in opazujemo spremembe podtipa bolnikove bolezni med njihovimi zaporednimi obiski z uporabo preskočnih nizov in markovskih verig. Diplomsko delo podaja natančno analizo naprednih tehnik strojnega učenja na podatkih časovnih vrst.
Sekundarne ključne besede: kognitivne bolezni;časovne vrste;gručenje;univerzitetni študij;diplomske naloge;Parkinsonova bolezen;Strojno učenje;Umetna inteligenca;Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000468
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 60 str.
ID: 18209048