diplomska naloga
Povzetek
Diplomska naloga se ukvarja z analizo sentimenta v novicah. To področje v zadnjem času pridobiva na priljubljenosti, predvsem v okviru napovedovanja gibanja finančnih trgov, vendar je za slovenski jezik še dokaj slabo raziskano. Za slovenščino sicer obstajajo modeli, osnovani na metodi podpornih vektorjev, vendar ti niso dostopni za javno uporabo.
V okviru te raziskave smo zasnovali arhitekturo na osnovi nevronskih mrež, ki za klasifikacijo uporablja kombinacijo samodejno generiranih značilk in TF-IDF obtežitev. Modeli, ki uporabljajo omenjeno arhitekturo, dosegajo primerljive rezultate z že obstoječimi modeli in so sposobni učinkovitega učenja na korpusih v velikosti okrog 10.000 dokumentov. Najuspešnejši model iz raziskave je na voljo kot spletna storitev na naslovu classify.ijs.si.
Ključne besede
analiza sentimenta;novice;slovenščina;nevronske mreže;globoko učenje;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2019 |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
FIŠ - Fakulteta za informacijske študije v Novem mestu |
Založnik: |
[A. Pelicon] |
UDK: |
004.032.26(043.2) |
COBISS: |
2048611347
|
Št. ogledov: |
356 |
Št. prenosov: |
16 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni povzetek: |
The present thesis deals with the sentiment analysis of news. This field has recently gained in popularity, especially as a supporting method for stock market prediction, but not much research has yet been done on the news in the Slovenian language. Models based on support vector machines do exist but are not available for public use.
We developed a neural network architecture that leverages both automatically generated features and TF-IDF weights for classification of Slovenian news. Models based on this architecture achieve comparable results with existing models and can be successfully trained on datasets of approximately 10,000 documents. Our best performing model is available for public use in the form of a web service on the URL classify.ijs.si. |
Sekundarne ključne besede: |
sentiment analysis;news;Slovene;neural networks;deep learning; |
Vrsta dela (COBISS): |
Diplomsko delo/naloga |
Komentar na gradivo: |
Fakulteta za informacijske študije v Novem mestu |
Komentar vira: |
Na ov.: Diplomska naloga : visokošolskega strokovnega študijskega programa prve stopnje;
|
Strani: |
XI, 51 str. |
ID: |
11237998 |