Spodbujevalno učenje na problemu igre Pacman

diplomsko delo

Deni Cerovac (Avtor), Aleksander Sadikov (Mentor)

Povzetek

Diplomsko delo Spodbujevalno učenje na problemu igre Pacman prikazuje mojo motivacijo, ki me je pritegnila k izbiri takšnega projekta. V diplomskem delu smo opravili teoretičen pregled delovanja algoritmov na principu spodbujevalnega učenja, kjer smo tudi pregledali teoretično ozadje algoritmov Q-učenje in globoko Q-učenje, katera smo tudi implementirali in uporabili na igri Pacman. Naš pristop je bil poseben zaradi primerjave uspešnosti algoritmov v okolju, kjer imata algoritma zelo omejeno gibanje in vpliv na delovanje samega akterja. Glede na pridobljeno znanje smo v celoti projekta implementirali oba algoritma, ki sta se učila na dani igri in nam vrnila zanimive rezultate. Med implementacijo smo doživeli veliko izzivov, nekatere zabavne, nekatere pa ne, katere smo uspešno premagali. Na podlagi pridobljenih rezultatov smo ugotovili, da sta se kljub omejenem gibanju in vplivanju na karakterjevo obnašanje algoritma odrezala podobno in v nekaterih primerih bistveno boljše kot amaterski igralci igre Pacman.

Ključne besede

nevronske mreže;Q-učenje;globoko Q-učenje;strojno učenje;spodbujevalno učenje;računalništvo in informatika;univerzitetni študij;diplomske naloge;

Podatki

Jezik:	Slovenski jezik
Leto izida:	2020
Tipologija:	2.11 - Diplomsko delo
Organizacija:	UL FRI - Fakulteta za računalništvo in informatiko
Založnik:	[D. Cerovac]
UDK:	004.8(043.2)
COBISS:	30969091
Št. ogledov:	860
Št. prenosov:	155
Ocena:	0 (0 glasov)
Metapodatki:

Ostali podatki

Sekundarni jezik:	Angleški jezik
Sekundarni naslov:	Pacman implementation using reinforcement learning
Sekundarni povzetek:	Bachelors project Pacman implementation using reinforcement learning, shows the reason and motivation that made me choose this project. In bachelors project we went over theoretical principals of Reinforcement learning algorithms, where we explained theoretical background of Q-learning and Deep Q-learning which we implemented and used on a game Pacman. Our approach was special because of our comparison of success between these two algorithms which were implemented on a game with restricted ability to impact on the movement and decision of our agent. Based on the accumulated knowledge in the course of our project we implemented both algorithms, that when finished returned some interesting results. Throughout our implementation we experienced a lot of challenges, some more fun than others, but in the end we successfully resolved all of them. Based on gathered results we found out that despite restricted movement of our agent, the algorithms were in average approximately as good or in some cases drastically better than average amateur Pacman players.
Sekundarne ključne besede:	neural networks;Q-learning;deep Q-learning;machine learning;reinforcement learning;computer and information science;diploma thesis;
Vrsta dela (COBISS):	Diplomsko delo/naloga
Študijski program:	1000468
Konec prepovedi (OpenAIRE):	1970-01-01
Komentar na gradivo:	Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani:	35 str.
ID:	12033197