diplomsko delo
Povzetek
V diplomskem delu raziskujemo uporabo velikih jezikovnih modelov (VJM)
za avtomatsko prepoznavanje pripovednih motivov v ljudskih pravljicah.
Najprej predstavimo folkloristično teorijo motivov, klasifikacijske sisteme
(ATU, Thompson) ter sodobne digitalne zbirke. Obravnavamo temeljne koncepte
obdelave naravnega jezika in arhitekturo velikih modelov, s poudarkom
na učenju z navodili. V eksperimentalnem delu uporabimo model Gemma 7B,
ki ga učimo na strukturiranih primerih zgodb in motivov. Preizkusimo več
učnih strategij (polno prilagajanje, LoRA, destilacija z Gemini 2.5 Pro) ter
izvedemo kvantitativno in kvalitativno evalvacijo rezultatov. Ugotovimo, da
so VJM-ji sposobni učinkovite klasifikacije motivov, še posebej, ko so podatki
obogateni z verigami misli. Delo prispeva k razvoju orodij za računalniško
folkloristiko in kaže možnosti za nadaljnje raziskave.
Ključne besede
veliki jezikovni modeli;obdelava naravnega jezika;pravljice;motivi v pravljicah;diplomske naloge;
Podatki
| Jezik: |
Slovenski jezik |
| Leto izida: |
2025 |
| Tipologija: |
2.11 - Diplomsko delo |
| Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
| Založnik: |
[D. Beden] |
| UDK: |
004.85:82(043.2) |
| COBISS: |
247357187
|
| Št. ogledov: |
100 |
| Št. prenosov: |
23 |
| Ocena: |
0 (0 glasov) |
| Metapodatki: |
|
Ostali podatki
| Sekundarni jezik: |
Angleški jezik |
| Sekundarni naslov: |
Detection of folkloristic motifs with large language models |
| Sekundarni povzetek: |
This thesis explores the use of large language models (LLMs) for the automatic
recognition of narrative motifs in folktales. We begin by presenting
folkloristic theory on motifs, classification systems (ATU, Thompson), and
modern digital corpora. We outline key natural language processing concepts
and LLM architectures, with an emphasis on instruction-based learning. In
the experimental part, we fine-tune the Gemma 7B model on structured examples
linking stories and motifs. We evaluate several learning strategies
(full fine-tuning, LoRA, distillation using Gemini 2.5 Pro) and perform both
quantitative and qualitative evaluations. Our results show that LLMs can
effectively classify motifs, especially when the dataset is enriched with chainof-
thought explanations. This work contributes to the field of computational
folkloristics and opens pathways for further research. |
| Sekundarne ključne besede: |
large language models;natural language processing;motifs in folktales;folktales;computer and information science;diploma; |
| Vrsta dela (COBISS): |
Diplomsko delo/naloga |
| Študijski program: |
1000468 |
| Komentar na gradivo: |
Univ. v Ljubljani, Fak. za računalništvo in informatiko |
| Strani: |
1 spletni vir (1 datoteka PDF (74 str.)) |
| ID: |
27132409 |