magistrsko delo
Aleš Pečovnik (Avtor), Milan Ojsteršek (Mentor)

Povzetek

V magistrskem delu je opisano področje označevanja imenskih entitet vključno z razpoložljivimi pristopi. Podrobneje je razdelano področje strojnega učenja, tako nadzorovanega, delno nadzorovanega kot nenadzorovanega, z opisi nekaj pogosto uporabljanih metod. V magistrskem delu smo izdelali in preizkusili sistem označevanja imenskih entitet v besedilih, ki so napisana v slovenskem jeziku. Uporabili smo strojno učenje z metodo pogojnih naključnih polj. Opisani so posamezni deli sistema, uporabljen podatkovni vir za učenje sistema, za tem pa sam potek preizkušanja in dobljeni rezultati ter ugotovitve. Rezultati za kategoriji geografskih in lastnih imen so bili zadovoljivi, obstajajo pa še razne možnosti za nadaljnji napredek na tem področju, ki je tudi nujen zaradi naraščajočih potreb po uporabi takšnih sistemov.

Ključne besede

obdelovanje naravnega jezika;strojno učenje;označevanje imenskih entitet;pogojna naključna polja;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.09 - Magistrsko delo
Organizacija: UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Založnik: A. Pečovnik
UDK: 004.5:004.86(043.2)
COBISS: 22123286 Povezava se bo odprla v novem oknu
Št. ogledov: 1665
Št. prenosov: 146
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Named entity recognition in texts using machine learning methods
Sekundarni povzetek: The thesis describes the field of named entity recognition along with possible approaches, where machine learning methods are depicted in details. This includes some of the most commonly used methods from supervised, semi supervised and unsupervised areas. The purpose of the Master thesis was to develop and test a system for named entity recognition in Slovenian texts using a machine learning method, whereby the conditional random field method was chosen. Individual parts of the system and the used data source are further elaborated, which is followed by the course of the experiment itself, together with the obtained results and findings. Results for the geographical and personal name entities were satisfactory; however, there are still various possibilities for further progress in the field of named entity recognition, which is also necessary due to the growing demand for such systems.
Sekundarne ključne besede: natural language processing;machine learning;named entity recognition;conditional random fields;
URN: URN:SI:UM:
Vrsta dela (COBISS): Magistrsko delo/naloga
Komentar na gradivo: Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Računalništvo in informacijske tehnologije
Strani: VIII, 79 f.
ID: 11000640
Priporočena dela:
, Bayesian attention networks for reliable hate speech detection