diplomsko delo

Povzetek

V okviru diplomske naloge sem razvil model, ki povzema daljša besedila v slovenskem jeziku. Pri tem sem si pomagal z obstoječimi vnaprej naučenimi nevronskimi mrežami tipa transformer, kot sta mBART in Longformer. Za učenje sem uporabil podatkovno množico akademskih del in njihovih povzetkov KAS 2.0. Model sem evalviral z obstoječimi merami za ocenjevanje povzetkov in tudi ročno. Kvalitativno gledano model za nekatera besedila (okoli 36%) vrne dober povzetek, ki vsebuje pomembne informacije iz besedila, medtem ko je za večino besedil (okoli 63%) manj uspešen.

Ključne besede

globoke nevronske mreže;avtomatsko povzemanje daljših besedil;slovenski jezik;univerzitetni študij;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [B. Colnar]
UDK: 004.8:81'322.2(043.2)
COBISS: 123603203 Povezava se bo odprla v novem oknu
Št. ogledov: 35
Št. prenosov: 17
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Automatic summarization of long texts in Slovene
Sekundarni povzetek: I developed a model that summarises long texts in Slovenian. I used existing pre-trained transformer based neural networks such as mBART and Longformer. I used the KAS 2.0 dataset of academic papers and their abstracts. I evaluated the model using existing summary evaluation criteria and also manually. Qualitatively, for some texts (around 36%) the model returns a good summary containing the relevant information from the text, while for most texts (around 63%) it performs less well.
Sekundarne ključne besede: Obdelava naravnega jezika (računalništvo);Računalniško jezikoslovje;Nevronske mreže (računalništvo);Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000468
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 62 str.
ID: 16469444