magistrsko delo

Povzetek

Klasifikacija novic o podjetjih predstavlja časovno zelo dolgotrajen proces, saj je vsako novico potrebno prebrati in ji na podlagi vsebine določiti vsebinski pomen. Z razvojem metod za podatkovno rudarjenje lahko ta proces avtomatiziramo, s čimer novice razvrščamo v zanemarljivem času. V okviru magistrskega dela smo razvili sistem pridobivanja, prečiščevanja in klasifikacije novic. Novice smo pridobivali iz brezplačnih spletnih virov ter si ustvarili korpus besedil, ki smo jih najprej obdelali z orodjem Orange ter nato zgradili napovedne modele z uporabo različnih algoritmov. S pomočjo vizualizacij in matrike zamenjav smo prikazali kakovost napovednih modelov ter jih na podlagi njihove uspešnosti ovrednotili. S pomočjo ML.NET knjižnice smo na koncu razvili sistem avtomatske klasifikacije, ki novice glede na njihovo vsebino z 80 % natančnostjo klasificira v skupine.

Ključne besede

podatkovno rudarjenje;klasifikacija tekstov;trgovanje;novice;vrednostni papir;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.09 - Magistrsko delo
Organizacija: UM FOV - Fakulteta za organizacijske vede
Založnik: [J. Jakič]
UDK: 004.6
COBISS: 72527363 Povezava se bo odprla v novem oknu
Št. ogledov: 294
Št. prenosov: 22
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Implementation of the securities news classification system
Sekundarni povzetek: Classification of news about companies represents a very time-consuming process, as each news has to be completely read to determine its content meaning. By using already developed data mining methods, we can automate this process and classify news in a negligible amount of time. During our master's thesis, we developed a system for obtaining, refining and classifying news. We obtained news from free online sources and created a corpus of texts. We first processed texts with the Orange tool, then we built predictive models by using different algorithms. Using visualizations and confusion matrices, we demonstrated the quality of predictive models, which were then evaluated based on their performance. We finally developed an automatic classification system by using ML.NET library, which is capable of classifying news into groups with 80 % accuracy.
Sekundarne ključne besede: Podatkovno rudarjenje;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Magistrsko delo/naloga
Komentar na gradivo: Univ. v Mariboru, Fak. za organizacijske vede
Strani: VI, 69 f.
ID: 12578501