diplomsko delo

Povzetek

Detekcija anomalij v časovnih vrstah je pomembna za različna področja, kot so finance, zdravstvo, proizvodnja in okoljevarstvo. V praksi so podatki o anomalijah v podatkih redko na voljo, zato je potrebno uporabiti nenadzorovane metode za detekcijo anomalij. V diplomski nalogi smo primerjali 4 metode za nenadzorovano detekcijo anomalij: matrix profile, LOF, isolation forest in samokodirnik. Metode so iz različnih področij računalništva, kot so detekcija osamelcev, strojno učenje in globoko učenje. Razlikujejo so tudi po načinu odkrivanja anomalij: z merjenjem razdalj med časovnimi vrstami, uporabo drevesnih struktur in rekonstrukcijo. Za ovrednotenje metod smo uporabili podatkovni nabor UCR Anomaly Archive in umetno generiran nabor časovnih vrst z anomalijami. Pri vseh metodah smo uporabili tudi dinamično velikost drsečega okna, ki smo jo določili glede na značilnosti posamezne časovne vrste. Izbrane metode smo uporabili tudi za detekcijo anomalij na realnih podatkih iz proizvodnje, ki jih je priskrbelo podjetje Senso4s d.o.o.. Najboljše rezultate smo dosegli z metodo matrix profile, z nekoliko slabšimi rezultati in krajšim izvajalnim časom pa ji je sledila metoda LOF.

Ključne besede

detekcija anomalij;nenadzorovano učenje;časovne vrste;samokodirnik;univerzitetni študij;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [L. S. Pecoraro]
UDK: 004(043.2)
COBISS: 162288387 Povezava se bo odprla v novem oknu
Št. ogledov: 64
Št. prenosov: 27
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Unsupervised anomaly detection in time series
Sekundarni povzetek: Time series anomaly detection is an important task applied in various fields such as finance, healthcare, and meteorological monitoring. Information about the locations of anomalies in various time series is rarely available in real-life settings. Therefore it is necessary to use unsupervised methods for anomaly detection. In this thesis, we compared four unsupervised anomaly detection methods: matrix profile, LOF, isolation forest, and autoencoder. The selected methods belong to different fields of computer science and statistics such as outlier detection, machine learning, and deep learning. They also differ in the way they detect anomalies: measuring distances between time series, using tree structures, and reconstruction. To evaluate the methods, we used the UCR Anomaly Archive dataset and an artificially generated set of time series with anomalies. We also applied a dynamic sliding window size to all methods, which was determined according to the characteristics of different time series. We also used the selected methods to detect anomalies detection on real production data provided by the company Senso4s Ltd.. The best results were obtained with the matrix profile method, followed by the LOF method with slightly worse results and a shorter running time.
Sekundarne ključne besede: anomaly detection;unsupervised learning;time series;matrix profile;isolation forest;LOF;autoencoder;computer science;diploma;Odkrivanje anomalij (varnost računalniških sistemov);Analiza časovnih vrst;Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000468
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 55 str.
ID: 19833930