diplomsko delo
Gal Šubic (Avtor), Marko Robnik Šikonja (Mentor)

Povzetek

Razlaga s protiprimeri je metoda razlage napovednih modelov strojnega učenja. V nalogi opišemo več načinov generiranja protiprimerov pri besedilnih klasifikatorjih, LIME-C, Polyjuice in ChatGPT, ter izpostavimo njihove ključne značilnosti. Uporabimo jih na treh različnih besedilnih podatkovnih množicah. Uporabljene metode in pridobljene protiprimere primerjamo in jih ocenimo po kriterijih za ocenjevanje kakovosti protiprimerov. Ugotovimo, da ni ene same najboljše rešitve in da ima vsak pristop prednosti in slabosti. Kljub temu se izkaže, da so trenutno najsplošnejša in uporabna rešitev protiprimeri, generirani z velikim jezikovnim modelom ChatGPT.

Ključne besede

razlaga napovednega modela strojnega učenja;protiprimeri;razlaga s protiprimeri;LIME-C;Polyjuice;ChatGPT;univerzitetni študij;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [G. Šubic]
UDK: 004.85:81'322(043.2)
COBISS: 170240003 Povezava se bo odprla v novem oknu
Št. ogledov: 75
Št. prenosov: 14
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Counterfactual explanation of text classifiers
Sekundarni povzetek: Counterfactual explanations are used for interpreting predictive machine learning models. We describe three methods for generating counterfactual examples, LIME-C, Polyjuice and ChatGPT, and highlight their key features. We apply them to three different text datasets. We compare the methods used and the obtained counterfactual examples and evaluate them according to the quality criteria of counterfactual examples. We conclude that there is no single best solution and that each approach has advantages and disadvantages. Nevertheless, the most general and useful solution at the moment are the counterfactual examples generated with ChatGPT large language model.
Sekundarne ključne besede: machine learning;explaining machine learning prediction model;counterfactual examples;LIME-C;Polyjuice;ChatGPT;computer science;diploma;Strojno učenje;Računalniško jezikoslovje;Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000468
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 43 str.
ID: 20325615