diplomsko delo
Povzetek
Spremljanje raziskovalnih tematik znanstvenih objav skupine raziskovalcev je zanimivo in hkrati pomembno za razumevanje razvoja nekega znanstvenega področja in raziskovalcev, ki delujejo na področju. Raziskovalci se ukvarjajo z različnimi področji, zato se tudi teme, o katerih pišejo v znanstvenih objavah, razlikujejo. Na podlagi besed, ki so uporabljene v znanstvenih člankih, lahko določimo teme, o katerih raziskovalci razpravljajo. V diplomski nalogi je opisano pridobivanje podatkov o člankih, njihova analiza in modeliranje tem člankov. Izvedena je bila tudi analiza o zastopanosti različnih tem skozi čas, kar nam pove o aktualnosti tem v določenem času. Zgrajen sistem smo uporabili za analizo publikacij Fakultete za računalništvo in informatiko Univerze v Ljubljani.
Ključne besede
modeliranje tem;model LDA;rudarjenje besedil;vizualizacija;razvoj tematik;obdelava naravnega jezika;računalništvo;računalništvo in informatika;visokošolski strokovni študij;diplomske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2019 |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
Založnik: |
[M. Debenjak] |
UDK: |
004.93(043.2) |
COBISS: |
1538354371
|
Št. ogledov: |
756 |
Št. prenosov: |
207 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Tracking research topics |
Sekundarni povzetek: |
Following the research topics of the scientific publications of a group of researchers is interesting and at the same time important for understanding the development of a scientific field and researchers working in it. The researchers do not work in the same field, therefore the topics of their work differ. Topics of the articles can be identified on the basis of words used. The thesis describes the acquisition of data on articles, their analysis and modelling of topics that they discuss. In addition, an analysis was conducted on the representation of different topics over time, which shows most frequently discussed topics in certain time periods. This system was used for the analysis of publications of the Faculty of Computer and Information Science of the University of Ljubljana. |
Sekundarne ključne besede: |
topic modeling;LDA model;text mining;visualization;topic development;natural language processing;computer science;computer and information science;diploma; |
Vrsta dela (COBISS): |
Diplomsko delo/naloga |
Študijski program: |
1000470 |
Konec prepovedi (OpenAIRE): |
1970-01-01 |
Komentar na gradivo: |
Univ. v Ljubljani, Fak. za računalništvo in informatiko |
Strani: |
27 str. |
ID: |
11226244 |