magistrsko delo
Povzetek
Klasifikacija novic o podjetjih predstavlja časovno zelo dolgotrajen proces, saj je vsako novico potrebno prebrati in ji na podlagi vsebine določiti vsebinski pomen. Z razvojem metod za podatkovno rudarjenje lahko ta proces avtomatiziramo, s čimer novice razvrščamo v zanemarljivem času. V okviru magistrskega dela smo razvili sistem pridobivanja, prečiščevanja in klasifikacije novic. Novice smo pridobivali iz brezplačnih spletnih virov ter si ustvarili korpus besedil, ki smo jih najprej obdelali z orodjem Orange ter nato zgradili napovedne modele z uporabo različnih algoritmov. S pomočjo vizualizacij in matrike zamenjav smo prikazali kakovost napovednih modelov ter jih na podlagi njihove uspešnosti ovrednotili. S pomočjo ML.NET knjižnice smo na koncu razvili sistem avtomatske klasifikacije, ki novice glede na njihovo vsebino z 80 % natančnostjo klasificira v skupine.
Ključne besede
podatkovno rudarjenje;klasifikacija tekstov;trgovanje;novice;vrednostni papir;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2021 |
Tipologija: |
2.09 - Magistrsko delo |
Organizacija: |
UM FOV - Fakulteta za organizacijske vede |
Založnik: |
[J. Jakič] |
UDK: |
004.6 |
COBISS: |
72527363
|
Št. ogledov: |
294 |
Št. prenosov: |
22 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Implementation of the securities news classification system |
Sekundarni povzetek: |
Classification of news about companies represents a very time-consuming process, as each news has to be completely read to determine its content meaning. By using already developed data mining methods, we can automate this process and classify news in a negligible amount of time. During our master's thesis, we developed a system for obtaining, refining and classifying news. We obtained news from free online sources and created a corpus of texts. We first processed texts with the Orange tool, then we built predictive models by using different algorithms. Using visualizations and confusion matrices, we demonstrated the quality of predictive models, which were then evaluated based on their performance. We finally developed an automatic classification system by using ML.NET library, which is capable of classifying news into groups with 80 % accuracy. |
Sekundarne ključne besede: |
Podatkovno rudarjenje;Univerzitetna in visokošolska dela; |
Vrsta dela (COBISS): |
Magistrsko delo/naloga |
Komentar na gradivo: |
Univ. v Mariboru, Fak. za organizacijske vede |
Strani: |
VI, 69 f. |
ID: |
12578501 |