diplomsko delo
Erik Calcina (Avtor), Marko Robnik Šikonja (Mentor), Erik Novak (Komentor)

Povzetek

V sodobnem svetu se vsak dan prebijamo skozi poplavo novic. Za njihovo lažje iskanje je koristno, če so novice združene glede na pripadajoče dogodke. V diplomski nalogi predstavimo metodologijo za gručenje novic v dogodke. Metodologija kombinira uporabo tekstovnih vložitev, algoritma za gručenje in metod za filtriranje novic. Metodologijo smo preizkusili na naboru podatkov spletnih novic ter naredili statistično in ročno evalvacijo. Rezultati so pokazali, da gruče novice v večini opisujejo enake dogodke. Posledica višje natančnosti je veliko nerazporejenih novic.

Ključne besede

novice;dogodki;gručenje novic;detekcija dogodkov;jezikovni model;visokošolski strokovni študij;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [E. Calcina]
UDK: 004.85:81'322(043.2)
COBISS: 163762435 Povezava se bo odprla v novem oknu
Št. ogledov: 8
Št. prenosov: 1
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Event-based news clustering
Sekundarni povzetek: In the modern world, we daily face a flood of news. For easier searching, it is useful if the news are grouped according to related events. In the thesis, we present a methodology for clustering news by events. The methodology combines the use of text embeddings, a clustering algorithm and news filtering methods. We tested the methodology on a dataset of online news and evaluated it statisticaly and manualy. The results indicate that the news clusters primarily depict the same events. However, higher accuracy is accompanied by a substantial amount of non-clustered news.
Sekundarne ključne besede: news;events;machine learning;news clustering;event detection;language model;computer science;diploma;Računalniško jezikoslovje;Strojno učenje;Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000470
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 23 str.
ID: 19904923