magistrsko delo
Povzetek
V magistrskem delu je opisano področje označevanja imenskih entitet vključno z razpoložljivimi pristopi. Podrobneje je razdelano področje strojnega učenja, tako nadzorovanega, delno nadzorovanega kot nenadzorovanega, z opisi nekaj pogosto uporabljanih metod. V magistrskem delu smo izdelali in preizkusili sistem označevanja imenskih entitet v besedilih, ki so napisana v slovenskem jeziku. Uporabili smo strojno učenje z metodo pogojnih naključnih polj. Opisani so posamezni deli sistema, uporabljen podatkovni vir za učenje sistema, za tem pa sam potek preizkušanja in dobljeni rezultati ter ugotovitve. Rezultati za kategoriji geografskih in lastnih imen so bili zadovoljivi, obstajajo pa še razne možnosti za nadaljnji napredek na tem področju, ki je tudi nujen zaradi naraščajočih potreb po uporabi takšnih sistemov.
Ključne besede
obdelovanje naravnega jezika;strojno učenje;označevanje imenskih entitet;pogojna naključna polja;diplomske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2019 |
Tipologija: |
2.09 - Magistrsko delo |
Organizacija: |
UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko |
Založnik: |
A. Pečovnik |
UDK: |
004.5:004.86(043.2) |
COBISS: |
22123286
|
Št. ogledov: |
1665 |
Št. prenosov: |
146 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Named entity recognition in texts using machine learning methods |
Sekundarni povzetek: |
The thesis describes the field of named entity recognition along with possible approaches, where machine learning methods are depicted in details. This includes some of the most commonly used methods from supervised, semi supervised and unsupervised areas. The purpose of the Master thesis was to develop and test a system for named entity recognition in Slovenian texts using a machine learning method, whereby the conditional random field method was chosen. Individual parts of the system and the used data source are further elaborated, which is followed by the course of the experiment itself, together with the obtained results and findings. Results for the geographical and personal name entities were satisfactory; however, there are still various possibilities for further progress in the field of named entity recognition, which is also necessary due to the growing demand for such systems. |
Sekundarne ključne besede: |
natural language processing;machine learning;named entity recognition;conditional random fields; |
URN: |
URN:SI:UM: |
Vrsta dela (COBISS): |
Magistrsko delo/naloga |
Komentar na gradivo: |
Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Računalništvo in informacijske tehnologije |
Strani: |
VIII, 79 f. |
ID: |
11000640 |