FighterZero

pristop samo-igranja za učenje igranja pretepaške igre z globokim spodbujevalnim učenjem

Matej Vitek (Avtor), Peter Peer (Mentor)

Povzetek

Področje globokega učenja je v zadnjem desetletju doživelo precejšen razcvet. Uporablja se za reševanje premnogih problemov, v zadnjih petih letih pa precej tudi za igranje iger. Dva pomembna dosežka sta bila globoke Q-mreže (DQN) in AlphaZero. DQN se je naučila igrati klasične igre za Atari 2600 (Pong, Space Invaders, itd.), AlphaZero pa se je s samo-igranjem naučil igrati šah, šogi in Go. Mi smo na temelju AlphaZero poskusili zgraditi agenta FighterZero, ki bi se prav tako s samo-igranjem naučil igrati pretepaške računalniške igre. Rezultati so bili manj uspešni, kot smo pričakovali, saj se je časovna zahtevnost izkazala za nepremagljivo oviro.

Ključne besede

umetna intiligenca;inteligentni agent;igre;samo-igranje;globoko učenje;spodbujevalno učenje;drevesno preiskovanje Monte Carlo;nevronske mreže;razvoj iger;

Podatki

Jezik:	Slovenski jezik
Leto izida:	2018
Tipologija:	2.09 - Magistrsko delo
Organizacija:	UL FRI - Fakulteta za računalništvo in informatiko
Založnik:	[M. Vitek]
UDK:	004
COBISS:	18432089
Št. ogledov:	1506
Št. prenosov:	343
Ocena:	0 (0 glasov)
Metapodatki:

Ostali podatki

Sekundarni jezik:	Angleški jezik
Sekundarni naslov:	FighterZero: a self-playing deep reinforcement learning agent for fighting game AI
Sekundarni povzetek:	Deep learning has been a field of great academic interest and substantial breakthroughs over the last decade. Its applications are many and over the last five years it has spread also to the field of game playing, owing largely to two chief accomplishments of Google's DeepMind team: Deep Q-Networks (DQN), which learned to play classic Atari 2600 games, and AlphaZero, which learned, strictly through self-play, to play the board games chess, shogi and Go. In this thesis we attempted to build on the success of AlphaZero by adapting its self-playing architecture to fighting games, a popular genre of video games. The results were, however, less successful than we had expected and hoped, as the time constraints proved to be an insurmountable obstacle.
Sekundarne ključne besede:	artificial intelligence;intelligent agent;games;self-playing;deep learning;reinforcement learning;Monte Carlo tree search;neural networks;game development;
Vrsta dela (COBISS):	Magistrsko delo/naloga
Študijski program:	0
Komentar na gradivo:	Univ. v Ljubljani, Fak. za matematiko in fiziko, Oddelek za matematiko, Računalništvo in matematika - 2. stopnja
Strani:	XV, 36 str.
ID:	10959377