Prepoznavanje motivov v pravljicah s pomočjo velikih jezikovnih modelov

diplomsko delo

Domen Beden (Avtor), Marko Robnik Šikonja (Mentor)

Povzetek

V diplomskem delu raziskujemo uporabo velikih jezikovnih modelov (VJM) za avtomatsko prepoznavanje pripovednih motivov v ljudskih pravljicah. Najprej predstavimo folkloristično teorijo motivov, klasifikacijske sisteme (ATU, Thompson) ter sodobne digitalne zbirke. Obravnavamo temeljne koncepte obdelave naravnega jezika in arhitekturo velikih modelov, s poudarkom na učenju z navodili. V eksperimentalnem delu uporabimo model Gemma 7B, ki ga učimo na strukturiranih primerih zgodb in motivov. Preizkusimo več učnih strategij (polno prilagajanje, LoRA, destilacija z Gemini 2.5 Pro) ter izvedemo kvantitativno in kvalitativno evalvacijo rezultatov. Ugotovimo, da so VJM-ji sposobni učinkovite klasifikacije motivov, še posebej, ko so podatki obogateni z verigami misli. Delo prispeva k razvoju orodij za računalniško folkloristiko in kaže možnosti za nadaljnje raziskave.

Ključne besede

veliki jezikovni modeli;obdelava naravnega jezika;pravljice;motivi v pravljicah;diplomske naloge;

Podatki

Jezik:	Slovenski jezik
Leto izida:	2025
Tipologija:	2.11 - Diplomsko delo
Organizacija:	UL FRI - Fakulteta za računalništvo in informatiko
Založnik:	[D. Beden]
UDK:	004.85:82(043.2)
COBISS:	247357187
Št. ogledov:	100
Št. prenosov:	23
Ocena:	0 (0 glasov)
Metapodatki:

Ostali podatki

Sekundarni jezik:	Angleški jezik
Sekundarni naslov:	Detection of folkloristic motifs with large language models
Sekundarni povzetek:	This thesis explores the use of large language models (LLMs) for the automatic recognition of narrative motifs in folktales. We begin by presenting folkloristic theory on motifs, classification systems (ATU, Thompson), and modern digital corpora. We outline key natural language processing concepts and LLM architectures, with an emphasis on instruction-based learning. In the experimental part, we fine-tune the Gemma 7B model on structured examples linking stories and motifs. We evaluate several learning strategies (full fine-tuning, LoRA, distillation using Gemini 2.5 Pro) and perform both quantitative and qualitative evaluations. Our results show that LLMs can effectively classify motifs, especially when the dataset is enriched with chainof- thought explanations. This work contributes to the field of computational folkloristics and opens pathways for further research.
Sekundarne ključne besede:	large language models;natural language processing;motifs in folktales;folktales;computer and information science;diploma;
Vrsta dela (COBISS):	Diplomsko delo/naloga
Študijski program:	1000468
Komentar na gradivo:	Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani:	1 spletni vir (1 datoteka PDF (74 str.))
ID:	27132409