pristop samo-igranja za učenje igranja pretepaške igre z globokim spodbujevalnim učenjem
Povzetek
Področje globokega učenja je v zadnjem desetletju doživelo precejšen razcvet. Uporablja se za reševanje premnogih problemov, v zadnjih petih letih pa precej tudi za igranje iger. Dva pomembna dosežka sta bila globoke Q-mreže (DQN) in AlphaZero. DQN se je naučila igrati klasične igre za Atari 2600 (Pong, Space Invaders, itd.), AlphaZero pa se je s samo-igranjem naučil igrati šah, šogi in Go. Mi smo na temelju AlphaZero poskusili zgraditi agenta FighterZero, ki bi se prav tako s samo-igranjem naučil igrati pretepaške računalniške igre. Rezultati so bili manj uspešni, kot smo pričakovali, saj se je časovna zahtevnost izkazala za nepremagljivo oviro.
Ključne besede
umetna intiligenca;inteligentni agent;igre;samo-igranje;globoko učenje;spodbujevalno učenje;drevesno preiskovanje Monte Carlo;nevronske mreže;razvoj iger;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2018 |
Tipologija: |
2.09 - Magistrsko delo |
Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
Založnik: |
[M. Vitek] |
UDK: |
004 |
COBISS: |
18432089
|
Št. ogledov: |
1506 |
Št. prenosov: |
343 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
FighterZero: a self-playing deep reinforcement learning agent for fighting game AI |
Sekundarni povzetek: |
Deep learning has been a field of great academic interest and substantial breakthroughs over the last decade. Its applications are many and over the last five years it has spread also to the field of game playing, owing largely to two chief accomplishments of Google's DeepMind team: Deep Q-Networks (DQN), which learned to play classic Atari 2600 games, and AlphaZero, which learned, strictly through self-play, to play the board games chess, shogi and Go. In this thesis we attempted to build on the success of AlphaZero by adapting its self-playing architecture to fighting games, a popular genre of video games. The results were, however, less successful than we had expected and hoped, as the time constraints proved to be an insurmountable obstacle. |
Sekundarne ključne besede: |
artificial intelligence;intelligent agent;games;self-playing;deep learning;reinforcement learning;Monte Carlo tree search;neural networks;game development; |
Vrsta dela (COBISS): |
Magistrsko delo/naloga |
Študijski program: |
0 |
Komentar na gradivo: |
Univ. v Ljubljani, Fak. za matematiko in fiziko, Oddelek za matematiko, Računalništvo in matematika - 2. stopnja |
Strani: |
XV, 36 str. |
ID: |
10959377 |