magistrska naloga

Povzetek

Živimo v času, ko si življenja brez računalnikov ne predstavljamo. Množična uporaba tako imenovane informacijsko komunikacijske tehnologije je proizvedla velike količine podatkov, ki jih sami ne moremo interpretirati in uporabiti. Z orodji podatkovnega rudarjenja in strojnega učenja se velike množice podatkov lahko obdelajo in uporabijo za napovedovanje in klasifikacijo. Eno od orodij za tako obdelavo podatkov je WEKA. Naloga temelji na osnovnem klasifikacijskem agoritem k najbližjih sosedov. V različnih panogah (gospodarstvo, zdravstvo, vojska...) se vedno bolj uporablja in shranjuje podatkovne baze raznovrstnih slik oziroma fotografij. Pri prepoznavanju podobosti med dvema fotografijama je pomembno, da algoritem prepozna določene vzorce. Prepoznavanje temelji na metriki. V ta namen je v orodje WEKA implementiran algoritem, ki temelji na Poincaréjevi metriki. Testiran je na podatkovni množici fotografij. Za namen primerjave je bil uporabljen algoritmom, ki temelji na evklidski metriki.

Ključne besede

podatkovno rudarjenje;strojno učenje;Poincaréjeva metrika;WEKA;k najbližjih sosedov;segmentacija;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.09 - Magistrsko delo
Organizacija: FIŠ - Fakulteta za informacijske študije v Novem mestu
Založnik: [A. Trpin]
UDK: 004.85:004.421(043.2)
COBISS: 2048549907 Povezava se bo odprla v novem oknu
Št. ogledov: 816
Št. prenosov: 63
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni povzetek: Today we cannot imagine life without computers. The massive use of the information communication technologies has produced large amounts of data that are difficult to interpret and use. With data mining tools and machine learning methods, large data sets can be processed and used for prediction and classification. One of the tools for such data processing is WEKA. The research in this thesis focuses on the basic classification algorithm the k nearest neighbors. In different industries (economy, health, military...) it increasingly uses and stores databases of various images or photographs. When recognizing the similarity between two photographs, it is important that the algorithm recognizes certain patterns. Recognition is based on metrics. For this purposes an algorithm based on Poincaré metric is implemented in WEKA and tested on a data set of photos. A comparison was made on algorithm based on Euclidean metric.
Sekundarne ključne besede: data mining;machine learning;Poincaré metric;WEKA;k nearest neighbours;segmentation;
Vrsta dela (COBISS): Magistrsko delo/naloga
Komentar na gradivo: Fakulteta za informacijske študije v Novem mestu
Komentar vira: Na ov.: Magistrska naloga : študijskega programa druge stopnje;
Strani: IX, 67 str.
ID: 10990070