magistrsko delo
Povzetek
V sklopu magistrske naloge smo se osredotočili na problematiko iskanja primernih revij za objavo znanstvenih člankov različnih avtorjev. V prvem delu smo se osredotočili na pridobivanje znanja iz nestrukturiranih podatkov. Za pridobivanje uporabnega znanja smo uporabili način besedne vložitve. V drugem delu smo se osredotočili na izgradnjo programske rešitve za vektorizacijo znanstvenih člankov in revij. Namen magistrske je bil ugotoviti, ali lahko s pomočjo strojnega učenja in tehnike vektorizacije besedila ugotovimo podobnosti med znanstvenimi članki različnih avtorjev in revij ter na takšen način ugotovimo, ali avtor objavlja svoje znanstvene članke v pravilnih revijah. Vhodni korpus smo pridobili iz spletne baze znanstvenih člankov Scopus. S pomočjo rezultatov programske rešitve smo opravili analizo, s pomočjo katere smo pridobili odgovore na zastavljena raziskovalna vprašanja ter posledično sprejeli ali zavrgli hipoteze.
Ključne besede
besedne vložitve;vektorizacija besedila;obdelava naravnega jezika;magistrske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2021 |
Tipologija: |
2.09 - Magistrsko delo |
Organizacija: |
UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko |
Založnik: |
[T. Šart] |
UDK: |
004.85:004.775(043.2) |
COBISS: |
60445699
|
Št. ogledov: |
445 |
Št. prenosov: |
58 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Machine learning based analysis of scientific journals and authors |
Sekundarni povzetek: |
As part of the master's thesis, we focused on the issue of finding suitable journals for the publication of scientific articles by various authors. In the first part, we focused on acquiring knowledge from unstructured data. We used the word embedding method to gain useful knowledge. In the second part, we focused on building a software solution for vectorization of scientific articles and journals. The purpose of the master's thesis was to determine whether we can use machine learning and text vectorization techniques to determine the similarities between scientific articles of different authors and journals and thus determine whether the author publishes his scientific articles in the correct journals. The input corpus was obtained from the online database of scientific articles Scoupus. With the help of the results of the software solution, we performed an analysis with the help of which we obtained answers to the posed research questions and consequently accepted or rejected the set hypotheses. |
Sekundarne ključne besede: |
DOC2VEC;TF-IDF;word embedding;text vectorization;natural language processing; |
Vrsta dela (COBISS): |
Magistrsko delo/naloga |
Komentar na gradivo: |
Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Informatika in tehnologije komuniciranja |
Strani: |
IX, 59 f. |
ID: |
12678869 |