diplomsko delo
Povzetek
V diplomski nalogi predstavljamo več različnih implementacij strojnega učenja računalniškega igralca za igranje igre s kartami Uno. Vsi uporabljeni algoritmi so s področja okrepitvenega učenja, saj so klasični algoritmi, ki se zanašajo na iskanje optimalne poteze na podlagi popolne informacije, neprimerni za igre z nepopolnimi informacijami. Algoritme smo primerjali glede na uspešnost v igranju proti igralcu, ki izbira naključne poteze, ter glede na krivuljo učenja, ki prikazuje pridobljeno povprečno kumulativno nagrado med procesom učenja.
Ključne besede
okrepitveno učenje;igra Uno;igre z nepopolnimi informacijami;igre s kartami;nevronske mreže;diplomske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2021 |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko |
Založnik: |
[M. Praskalo] |
UDK: |
004.85(043.2) |
COBISS: |
92402947
|
Št. ogledov: |
237 |
Št. prenosov: |
17 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Machine learning of a computer player in a card game |
Sekundarni povzetek: |
In this graduate thesis we present several different implementations of machine learning of a computer player for playing the Uno card game. All used algorithms are from the field of reinforcement learning, as classic algorithms that rely on finding optimal moves based on complete information are unsuitable for games with incomplete information.
We compared the algorithms according to their performance when playing against a player that chooses random actions, and according to the learning curve, which represents the obtained cumulative reward during the learning process. |
Sekundarne ključne besede: |
reinforcement learning;card game Uno;imperfect information games;card games;neural networks; |
Vrsta dela (COBISS): |
Diplomsko delo/naloga |
Komentar na gradivo: |
Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Računalništvo in informacijske tehnologije |
Strani: |
IX, 31 str. |
ID: |
13329157 |