Orodja za tekstovno rudarjenje v slovenščini

diplomsko delo

Maks Horvat (Avtor), Marko Robnik Šikonja (Mentor)

Povzetek

Orodja za tekstovno rudarjenje v slovenščini

Ključne besede

tekstovno rudarjenje;obdelava naravnega jezika;slovenski jezik;jezikovna orodja;visokošolski strokovni študij;računalništvo;računalništvo in informatika;diplomske naloge;

Podatki

Jezik:	Slovenski jezik
Leto izida:	2013
Tipologija:	2.11 - Diplomsko delo
Organizacija:	UL FRI - Fakulteta za računalništvo in informatiko
Založnik:	[M. Horvat]
UDK:	004(043.2)
COBISS:	9903956
Št. ogledov:	54
Št. prenosov:	3
Ocena:	0 (0 glasov)
Metapodatki:

Ostali podatki

Sekundarni jezik:	Angleški jezik
Sekundarni naslov:	Text mining tools for Slovene language
Sekundarni povzetek:	We introduce the use of various tools for Slovenian language processing and adapt them for NLTK library. To automatically determine the part of speech tags we use algorithms from the NLTK library. From Gigafida corpus we build several taggers: n-gram, Brill, naive Bayes, maximum entropy and hidden Markov model. We measure the accuracy of part of speech tags and time complexity of the taggers. We also incorporated Obeliks program for lemmatization and part of speech tags assignment. For text parsing and identification of named entities we use dependencyParser and SLNER tools. We develop and test a module for information retrieval. We use inverted index, search with boolean operators, vector representation of documents and cosine similarity.
Sekundarne ključne besede:	text mining;natural language processing;Slovenian language;language tools;computer science;computer and information science;diploma;
Vrsta datoteke:	application/pdf
Vrsta dela (COBISS):	Diplomsko delo/naloga
Komentar na gradivo:	Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani:	58 str.
ID:	24168236

Slovenski jezik

English language

Priporočena dela:

Orodja za tekstovno rudarjenje v slovenščini

2013, diplomsko delo

Sledenje razvoju raziskovalnih tematik

2019, diplomsko delo

Sistem za (pol)avtomatsko označevanje medicinskih izvidov z MKF kodami

2013, diplomsko delo

Implementacija SCA specifikacije

2013, diplomsko delo

Sistem za nadzor orodij

2013, diplomsko delo