diplomsko delo
Povzetek
Detekcija anomalij v časovnih vrstah je pomembna za različna področja, kot so finance, zdravstvo, proizvodnja in okoljevarstvo. V praksi so podatki o anomalijah v podatkih redko na voljo, zato je potrebno uporabiti nenadzorovane metode za detekcijo anomalij.
V diplomski nalogi smo primerjali 4 metode za nenadzorovano detekcijo anomalij: matrix profile, LOF, isolation forest in samokodirnik. Metode so iz različnih področij računalništva, kot so detekcija osamelcev, strojno učenje in globoko učenje. Razlikujejo so tudi po načinu odkrivanja anomalij: z merjenjem razdalj med časovnimi vrstami, uporabo drevesnih struktur in rekonstrukcijo.
Za ovrednotenje metod smo uporabili podatkovni nabor UCR Anomaly Archive in umetno generiran nabor časovnih vrst z anomalijami. Pri vseh metodah smo uporabili tudi dinamično velikost drsečega okna, ki smo jo določili glede na značilnosti posamezne časovne vrste.
Izbrane metode smo uporabili tudi za detekcijo anomalij na realnih podatkih iz proizvodnje, ki jih je priskrbelo podjetje Senso4s d.o.o..
Najboljše rezultate smo dosegli z metodo matrix profile, z nekoliko slabšimi rezultati in krajšim izvajalnim časom pa ji je sledila metoda LOF.
Ključne besede
detekcija anomalij;nenadzorovano učenje;časovne vrste;samokodirnik;univerzitetni študij;diplomske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2023 |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
Založnik: |
[L. S. Pecoraro] |
UDK: |
004(043.2) |
COBISS: |
162288387
|
Št. ogledov: |
64 |
Št. prenosov: |
27 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Unsupervised anomaly detection in time series |
Sekundarni povzetek: |
Time series anomaly detection is an important task applied in various fields such as finance, healthcare, and meteorological monitoring. Information about the locations of anomalies in various time series is rarely available in real-life settings. Therefore it is necessary to use unsupervised methods for anomaly detection.
In this thesis, we compared four unsupervised anomaly detection methods: matrix profile, LOF, isolation forest, and autoencoder. The selected methods belong to different fields of computer science and statistics such as outlier detection, machine learning, and deep learning. They also differ in the way they detect anomalies: measuring distances between time series, using tree structures, and reconstruction.
To evaluate the methods, we used the UCR Anomaly Archive dataset and an artificially generated set of time series with anomalies. We also applied a dynamic sliding window size to all methods, which was determined according to the characteristics of different time series. We also used the selected methods to detect anomalies detection on real production data provided by the company Senso4s Ltd..
The best results were obtained with the matrix profile method, followed by the LOF method with slightly worse results and a shorter running time. |
Sekundarne ključne besede: |
anomaly detection;unsupervised learning;time series;matrix profile;isolation forest;LOF;autoencoder;computer science;diploma;Odkrivanje anomalij (varnost računalniških sistemov);Analiza časovnih vrst;Računalništvo;Univerzitetna in visokošolska dela; |
Vrsta dela (COBISS): |
Diplomsko delo/naloga |
Študijski program: |
1000468 |
Konec prepovedi (OpenAIRE): |
1970-01-01 |
Komentar na gradivo: |
Univ. v Ljubljani, Fak. za računalništvo in informatiko |
Strani: |
55 str. |
ID: |
19833930 |