magistrsko delo
Povzetek
Odgovarjanje na vprašanja je pomembna in pogosto naslovljena naloga obdelave naravnega jezika v angleščini. Jezikom z manj viri, kakršna je slovenščina, je namenjeno manj pozornosti. V tem delu uporabimo enega izmed uspešnih angleških pristopov, poimenovanega UnifiedQA, in preizkusimo njegovo delovanje za slovenski jezik. Naučimo generativni model za odgovarjanje na vprašanja, ki pokriva štiri različne tipe vprašanj - da/ne, večizbirni, abstraktni in ekstraktivni tip. Za učenje uporabimo obstoječe podatkovne zbirke BoolQ, COPA, MultiRC in SQuAD 2.0 ter strojno prevedemo podatkovno zbirko MCTest. Pokažemo, da je splošni model sposoben odgovarjati na vprašanja v različnih formatih, saj deluje vsaj tako dobro kot namenski modeli, z vnosom angleškega znanja pa rezultate še izboljšamo.
Ključne besede
generativno odgovarjanje na vprašanja;slovenski jezik;globoke nevronske mreže;arhitektura transformer;magisteriji;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2022 |
Tipologija: |
2.09 - Magistrsko delo |
Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
Založnik: |
[K. Logar] |
UDK: |
004.8:81'322(043.2) |
COBISS: |
122046723
|
Št. ogledov: |
70 |
Št. prenosov: |
43 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Learning question answering in Slovene language |
Sekundarni povzetek: |
There have been many studies in the field of question answering for English language. Less attention has been devoted to low-resource languages, such as Slovene. In this work, we use one of successful English approaches, named UnifiedQA, and test its viability for Slovene language. We finetune a generative model for question answering, covering four different question formats - yes/no, multiple choice, abstractive and extractive format. For finetuning, we use existing datasets BoolQ, COPA, MultiRC and SQuAD 2.0 and machine translate the MCTest dataset. We show that a general model is capable of answering questions in different formats at least as well as specialized models. The results are further improved using examples in English language. |
Sekundarne ključne besede: |
generative question answering;Slovene language;deep neural networks;transformer architecture;computer science;computer and information science;master's degree;Obdelava naravnega jezika (računalništvo);Računalniško jezikoslovje;Nevronske mreže (računalništvo);Računalništvo;Univerzitetna in visokošolska dela; |
Vrsta dela (COBISS): |
Magistrsko delo/naloga |
Študijski program: |
1000471 |
Konec prepovedi (OpenAIRE): |
1970-01-01 |
Komentar na gradivo: |
Univ. v Ljubljani, Fak. za računalništvo in informatiko |
Strani: |
70 str. |
ID: |
16411039 |