undergraduate thesis
Matija Teršek (Avtor), Erik Štrumbelj (Mentor)

Povzetek

In this thesis we provide a compact review of 8 time series representations in combination with 2 clustering algorithms and 2 indices for internal clustering validation. We analyse time series measured by smart meter devices and check how their representations affect clustering. We conclude that no representation can be directly used for the task and that more focus should be put on preprocessing. Additionally, we compare representations and 4 similarity measures on simulated time series. We find out that similarity measures outperform representations in most cases and that a variational autoencoder-based representation works the best for simulated time series.

Ključne besede

time series;similarity measures;representations;clustering;recurrent neural networks;variational autoencoders;computer science;computer and information science;computer science and mathematics;interdisciplinary studies;diploma;

Podatki

Jezik: Angleški jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [M. Teršek]
UDK: 004(043.2)
COBISS: 28477443 Povezava se bo odprla v novem oknu
Št. ogledov: 451
Št. prenosov: 115
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Slovenski jezik
Sekundarni naslov: Gručenje časovnih vrst meritev pametnih merilnih naprav
Sekundarni povzetek: V diplomskem delu povzamemo 8 predstavitev časovnih vrst v kombinaciji z 2 algoritmoma za gručenje in 2 indeksoma za interno validacijo gručenja. Eksperimentalno preverimo vpliv predstavitev časovnih vrst na gručenje podatkov, ki so jih izmerile pametne merilne naprave. Ugotovimo, da nobena izmed predstavitev ni takoj in neposredno uporabna, in da se je bolj pomembno osredotočiti na predprocesiranje. Uporabnost predstavitev časovnih vrst v gručenju preverimo tudi na umetnih podatkih. Rezultate primerjamo z gručenjem celih časovnih vrst, kjer uporabimo 4 različne mere podobnosti. Ugotovimo, da so mere podobnosti v večini primerov boljše, najbolje pa se obnese predstavitev, ki temelji na variacijskem avtokodirniku.
Sekundarne ključne besede: časovne vrste;predstavitve;gručenje;rekurzivne nevronske mreže;variacijski avtokodirnik;mere podobnosti;računalništvo;računalništvo in informatika;računalništvo in matematika;interdisciplinarni študij;univerzitetni študij;diplomske naloge;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000407
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 48 str.
ID: 12027631
Priporočena dela:
, zbirnik za spletne brskalnike