magistrsko delo
Tevž Šart (Avtor), Sašo Karakatič (Mentor)

Povzetek

V sklopu magistrske naloge smo se osredotočili na problematiko iskanja primernih revij za objavo znanstvenih člankov različnih avtorjev. V prvem delu smo se osredotočili na pridobivanje znanja iz nestrukturiranih podatkov. Za pridobivanje uporabnega znanja smo uporabili način besedne vložitve. V drugem delu smo se osredotočili na izgradnjo programske rešitve za vektorizacijo znanstvenih člankov in revij. Namen magistrske je bil ugotoviti, ali lahko s pomočjo strojnega učenja in tehnike vektorizacije besedila ugotovimo podobnosti med znanstvenimi članki različnih avtorjev in revij ter na takšen način ugotovimo, ali avtor objavlja svoje znanstvene članke v pravilnih revijah. Vhodni korpus smo pridobili iz spletne baze znanstvenih člankov Scopus. S pomočjo rezultatov programske rešitve smo opravili analizo, s pomočjo katere smo pridobili odgovore na zastavljena raziskovalna vprašanja ter posledično sprejeli ali zavrgli hipoteze.

Ključne besede

besedne vložitve;vektorizacija besedila;obdelava naravnega jezika;magistrske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.09 - Magistrsko delo
Organizacija: UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Založnik: [T. Šart]
UDK: 004.85:004.775(043.2)
COBISS: 60445699 Povezava se bo odprla v novem oknu
Št. ogledov: 445
Št. prenosov: 58
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Machine learning based analysis of scientific journals and authors
Sekundarni povzetek: As part of the master's thesis, we focused on the issue of finding suitable journals for the publication of scientific articles by various authors. In the first part, we focused on acquiring knowledge from unstructured data. We used the word embedding method to gain useful knowledge. In the second part, we focused on building a software solution for vectorization of scientific articles and journals. The purpose of the master's thesis was to determine whether we can use machine learning and text vectorization techniques to determine the similarities between scientific articles of different authors and journals and thus determine whether the author publishes his scientific articles in the correct journals. The input corpus was obtained from the online database of scientific articles Scoupus. With the help of the results of the software solution, we performed an analysis with the help of which we obtained answers to the posed research questions and consequently accepted or rejected the set hypotheses.
Sekundarne ključne besede: DOC2VEC;TF-IDF;word embedding;text vectorization;natural language processing;
Vrsta dela (COBISS): Magistrsko delo/naloga
Komentar na gradivo: Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Informatika in tehnologije komuniciranja
Strani: IX, 59 f.
ID: 12678869