diplomska naloga

Povzetek

Diplomska naloga se ukvarja z analizo sentimenta v novicah. To področje v zadnjem času pridobiva na priljubljenosti, predvsem v okviru napovedovanja gibanja finančnih trgov, vendar je za slovenski jezik še dokaj slabo raziskano. Za slovenščino sicer obstajajo modeli, osnovani na metodi podpornih vektorjev, vendar ti niso dostopni za javno uporabo. V okviru te raziskave smo zasnovali arhitekturo na osnovi nevronskih mrež, ki za klasifikacijo uporablja kombinacijo samodejno generiranih značilk in TF-IDF obtežitev. Modeli, ki uporabljajo omenjeno arhitekturo, dosegajo primerljive rezultate z že obstoječimi modeli in so sposobni učinkovitega učenja na korpusih v velikosti okrog 10.000 dokumentov. Najuspešnejši model iz raziskave je na voljo kot spletna storitev na naslovu classify.ijs.si.

Ključne besede

analiza sentimenta;novice;slovenščina;nevronske mreže;globoko učenje;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: FIŠ - Fakulteta za informacijske študije v Novem mestu
Založnik: [A. Pelicon]
UDK: 004.032.26(043.2)
COBISS: 2048611347 Povezava se bo odprla v novem oknu
Št. ogledov: 356
Št. prenosov: 16
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni povzetek: The present thesis deals with the sentiment analysis of news. This field has recently gained in popularity, especially as a supporting method for stock market prediction, but not much research has yet been done on the news in the Slovenian language. Models based on support vector machines do exist but are not available for public use. We developed a neural network architecture that leverages both automatically generated features and TF-IDF weights for classification of Slovenian news. Models based on this architecture achieve comparable results with existing models and can be successfully trained on datasets of approximately 10,000 documents. Our best performing model is available for public use in the form of a web service on the URL classify.ijs.si.
Sekundarne ključne besede: sentiment analysis;news;Slovene;neural networks;deep learning;
Vrsta dela (COBISS): Diplomsko delo/naloga
Komentar na gradivo: Fakulteta za informacijske študije v Novem mestu
Komentar vira: Na ov.: Diplomska naloga : visokošolskega strokovnega študijskega programa prve stopnje;
Strani: XI, 51 str.
ID: 11237998