diplomsko delo
Mai Praskalo (Avtor), Damjan Strnad (Mentor), Štefan Kohek (Komentor)

Povzetek

V diplomski nalogi predstavljamo več različnih implementacij strojnega učenja računalniškega igralca za igranje igre s kartami Uno. Vsi uporabljeni algoritmi so s področja okrepitvenega učenja, saj so klasični algoritmi, ki se zanašajo na iskanje optimalne poteze na podlagi popolne informacije, neprimerni za igre z nepopolnimi informacijami. Algoritme smo primerjali glede na uspešnost v igranju proti igralcu, ki izbira naključne poteze, ter glede na krivuljo učenja, ki prikazuje pridobljeno povprečno kumulativno nagrado med procesom učenja.

Ključne besede

okrepitveno učenje;igra Uno;igre z nepopolnimi informacijami;igre s kartami;nevronske mreže;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Založnik: [M. Praskalo]
UDK: 004.85(043.2)
COBISS: 92402947 Povezava se bo odprla v novem oknu
Št. ogledov: 237
Št. prenosov: 17
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Machine learning of a computer player in a card game
Sekundarni povzetek: In this graduate thesis we present several different implementations of machine learning of a computer player for playing the Uno card game. All used algorithms are from the field of reinforcement learning, as classic algorithms that rely on finding optimal moves based on complete information are unsuitable for games with incomplete information. We compared the algorithms according to their performance when playing against a player that chooses random actions, and according to the learning curve, which represents the obtained cumulative reward during the learning process.
Sekundarne ključne besede: reinforcement learning;card game Uno;imperfect information games;card games;neural networks;
Vrsta dela (COBISS): Diplomsko delo/naloga
Komentar na gradivo: Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Računalništvo in informacijske tehnologije
Strani: IX, 31 str.
ID: 13329157