doktorska disertacija študijskega programa tretje bolonjske stopnje Arhivske znanosti

Povzetek

Namen: Namen doktorske disertacije je raziskati, ali je možna izdelava modela za urejanje in popisovanje nestrukturiranih besedil z uporabo strojnega učenja. Pri izdelavi modela je bila raziskava razdeljena na tri ključne segmente in povezana raziskovalna vprašanja, in sicer, ali je izdelava modela za samostojno klasifikacijo nestrukturiranih vsebin, samostojno prepoznavo imenskih entitet in samostojno izdelavo naslova popisne enote izvedljiva in uporabna. Metodologija: V raziskavi sta uporabljeni metoda analize vsebine in metoda eksperimenta. Raziskani so bili različni pristopi za izdelavo izvedbenega modela za urejanje in popisovanje nestrukturiranih besedil, ravno tako je bilo raziskana uporabnost izdelanega modela in učinkovitost izdelave popisne enote z uporabo izdelanega modela. Rezultati: Ugotovljeni rezultati raziskav kažejo, da je izdelava modela za urejanje in popisovanje nestrukturiranih besedil z uporabo strojnega učenja za vse tri segmente izvedljiva in uporabna, izdelani model pa predstavlja celoten formalni in aplikativni okvir za obdelavo nestrukturiranih besedil, ki se ga lahko neposredno uporabi za obdelavo nestrukturiranih podatkov. Izvirnost/uporabnost: Raziskava omogoča natančen vpogled v izdelavo modela za urejanje in popisovanje nestrukturiranih besedil ter izpostavlja prednosti in obliko uporabe izdelanega modela. Hkrati izdelani model in spremna dokumentiranost izdelave modela predstavljata podlago za uporabo modela v praksi in potencialno podlago za nadaljnje raziskave.

Ključne besede

urejanje in popisovanje;strojno učenje;imenske entitete;nestrukturirano besedilo;klasifikacija;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.08 - Doktorska disertacija
Organizacija: ESM - Evropsko središče Maribor
Založnik: [M. Milovanović]
UDK: 930.25:004.85(043.3)
COBISS: 213858563 Povezava se bo odprla v novem oknu
Št. ogledov: 208
Št. prenosov: 14
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni povzetek: Purpose: The purpose of the doctoral dissertation is to investigate whether it is possible to create a model for arrangement and archival description of unstructured texts using machine learning. When creating the model, the research was divided into three key segments and related research questions, namely whether the creation of a model for the standalone classification of unstructured texts, the standalone recognition of name entities and the standalone creation of the title of the unit of description is feasible and useful. Methodology: Methods content analysis and experiment are used in the research. Different approaches for creating an implementation model for arrangement and archival description of unstructured texts were investigated, as well as the usability of the developed model and the efficiency of creating a unit of description using the developed model. Results: The results of the research indicate that the creation of a model for arrangement and archival description of unstructured texts using machine learning is feasible and useful for all three segments, and the created model represents the entire formal and application framework for the processing of unstructured texts, which can be directly used for processing unstructured data. Originality/Usability: The research provides a detailed insight into the creation of a model for arrangement and archival description of unstructured texts and highlights the advantages and use cases of the created model. At the same time, the created model and the accompanying documentation of the model creation represent the basis for the use of the model in practice and a potential basis for further research.
Sekundarne ključne besede: arrangement and description;machine learning;named entities;unstructured text;classification;
Vrsta dela (COBISS): Doktorsko delo/naloga
Komentar na gradivo: Alma Mater Europaea - Evropski center, Maribor, Arhivske znanosti
Strani: [10] f., 167 str.
ID: 25480824