Učenje igranja igre štiri v vrsto z uporabo globokega spodbujevalnega učenja

magistrsko delo

Domen Lušina (Avtor), Matej Guid (Mentor)

Povzetek

Učenje igranja iger je ena izmed tem, s katero se raziskovalci s področja umetne inteligence ukvarjajo že od njenega začetka. Želimo ustvariti programe, s katerimi računalniku omogočimo inteligentno igranje iger. V zadnjih letih se za to vedno večkrat uporabljajo metode globokega učenja. AlphaZero je eden izmed algoritmov globokega spodbujevalnega učenja, ki je z velikim uspehom brez ekspertnega znanja naučil nadčloveško igrati šah, šogi in Go. V tem delu smo algoritem AlphaZero uporabili za učenje igre štiri v vrsto s poudarkom na raziskovanju vplivov vpeljave ekspertnega znanja na uspešnost delovanja programa. Predstavili smo več metod vpeljave ekspertne hevristike igre štiri v vrsto v fazo učenja algoritma AlphaZero. Uporabili smo več ekspertnih hevristik in različne metode vpeljave ekspertnega znanja. Evalvacija je potekala na vnaprej pripravljenih množicah pozicij iz različnih stadijev iger, s pomočjo iger s popravljanjem potez ter z igranjem proti nasprotnikom različnih težavnosti, vključno z optimalnim nasprotnikom. S hevristiko značilk, ki med drugim spodbuja povezovanje žetonov v vrsto, smo dosegli rahlo izboljšavo rezultatov.

Ključne besede

umetna inteligenca;globoko učenje;spodbujevalno učenje;drevesno preiskovanje Monte Carlo;nevronske mreže;ekspertna hevristika;

Podatki

Jezik:	Slovenski jezik
Leto izida:	2021
Tipologija:	2.09 - Magistrsko delo
Organizacija:	UL FRI - Fakulteta za računalništvo in informatiko
Založnik:	[D. Lušina]
UDK:	004.42
COBISS:	200663299
Št. ogledov:	1700
Št. prenosov:	156
Ocena:	0 (0 glasov)
Metapodatki:

Ostali podatki

Sekundarni jezik:	Angleški jezik
Sekundarni naslov:	Learning to play the game of connect four with deep reinforcement learning
Sekundarni povzetek:	Learning to play games has been a topic of interest to researchers since the early days of artificial intelligence. The goal is to create programs that enable computers to play games intelligently. In recent years, we have seen deep learning being used more and more. AlphaZero is one of the deep reinforcement learning algorithms that has achieved superhuman level of play in Chess, Shogi and Go without any domain knowledge. In this paper, we used AlphaZero to learn how to play the game Connect Four, with a focus on using expert knowledge to improve it. Several methods are presented that introduce expert heuristics into the learning phase of the AlphaZero algorithm. Using field and feature heuristics, we analyzed different methods on sets of positions, games with error corrections, and four different opponents, one of which plays optimally. By using the feature heuristic, which encourages connecting game pieces, we were able to slightly improve the results of the position sets as measured by various metrics.
Sekundarne ključne besede:	artificial intelligence;deep learning;reinforcement learning;Monte Carlo tree search;neural networks;expert heuristic;
Vrsta dela (COBISS):	Magistrsko delo/naloga
Študijski program:	0
Konec prepovedi (OpenAIRE):	1970-01-01
Komentar na gradivo:	Univ. v Ljubljani, Fak. za matematiko in fiziko, Oddelek za matematiko, Računalništvo in matematika - 2. stopnja
Strani:	XIII, 81 str.
ID:	12568955