diplomsko delo
Povzetek
V zaključnem delu smo zasnovali računalniški program AlphaLady, ki se je sposoben naučiti igranja igre dama brez vnosa človeškega znanja. Za dosego tega smo uporabili vzpodbujevalno učenje, drevesno preiskovanje Monte Carlo in globoke konvolucijske mreže za ocenitev posameznih stanj v igri. Predstavili smo programe Alpha Go, AlphaGo Zero in AlphaZero, na podlagi katerih je zasnovan naš program. Opisali smo uporabljeno ogrodje in teoretično ozadje uporabljenih pristopov. Uspelo nam je naučiti 9 različic programa, pri čemer je vsaka naslednja različica enakovredna ali boljša kot prejšnja.
Ključne besede
umetna inteligenca;globoko učenje;konvolucijska nevronska mreža;drevesno preiskovanje Monte Carlo;vzpodbujevalno učenje;igra dama;diplomske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2019 |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko |
Založnik: |
[J. Popič] |
UDK: |
004.8(043.2) |
COBISS: |
22848534
|
Št. ogledov: |
907 |
Št. prenosov: |
205 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Deep Learning and the game of Checkers |
Sekundarni povzetek: |
In the thesis, we designed a computer program AlphaLady, which is capable of learning to play the game of checkers without human knowledge. To achieve this we have used reinforcement learning, Monte Carlo tree search and deep convolutional neural network for evaluating board positions. Our program is based on the introduced programs Alpha Go, AlphaGo Zero and AlphaZero. We described a framework that was used for implementation and theoretical background of used approaches. We managed to train 9 versions of our program, with each successive version being equal or better than the previous one. |
Sekundarne ključne besede: |
artificial intelligence;deep learning;convolutional neural network;Monte Carlo tree search;reinforcement learning;checkers; |
Vrsta dela (COBISS): |
Diplomsko delo/naloga |
Komentar na gradivo: |
Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Računalništvo in informacijske tehnologije |
Strani: |
XVII, 50 str. |
ID: |
11205917 |