diplomsko delo
Miha Debenjak (Avtor), Tomaž Curk (Mentor)

Povzetek

Spremljanje raziskovalnih tematik znanstvenih objav skupine raziskovalcev je zanimivo in hkrati pomembno za razumevanje razvoja nekega znanstvenega področja in raziskovalcev, ki delujejo na področju. Raziskovalci se ukvarjajo z različnimi področji, zato se tudi teme, o katerih pišejo v znanstvenih objavah, razlikujejo. Na podlagi besed, ki so uporabljene v znanstvenih člankih, lahko določimo teme, o katerih raziskovalci razpravljajo. V diplomski nalogi je opisano pridobivanje podatkov o člankih, njihova analiza in modeliranje tem člankov. Izvedena je bila tudi analiza o zastopanosti različnih tem skozi čas, kar nam pove o aktualnosti tem v določenem času. Zgrajen sistem smo uporabili za analizo publikacij Fakultete za računalništvo in informatiko Univerze v Ljubljani.

Ključne besede

modeliranje tem;model LDA;rudarjenje besedil;vizualizacija;razvoj tematik;obdelava naravnega jezika;računalništvo;računalništvo in informatika;visokošolski strokovni študij;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [M. Debenjak]
UDK: 004.93(043.2)
COBISS: 1538354371 Povezava se bo odprla v novem oknu
Št. ogledov: 756
Št. prenosov: 207
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Tracking research topics
Sekundarni povzetek: Following the research topics of the scientific publications of a group of researchers is interesting and at the same time important for understanding the development of a scientific field and researchers working in it. The researchers do not work in the same field, therefore the topics of their work differ. Topics of the articles can be identified on the basis of words used. The thesis describes the acquisition of data on articles, their analysis and modelling of topics that they discuss. In addition, an analysis was conducted on the representation of different topics over time, which shows most frequently discussed topics in certain time periods. This system was used for the analysis of publications of the Faculty of Computer and Information Science of the University of Ljubljana.
Sekundarne ključne besede: topic modeling;LDA model;text mining;visualization;topic development;natural language processing;computer science;computer and information science;diploma;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000470
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 27 str.
ID: 11226244