diplomsko delo
Jan Popič (Avtor), Borko Bošković (Mentor), Janez Brest (Komentor)

Povzetek

V zaključnem delu smo zasnovali računalniški program AlphaLady, ki se je sposoben naučiti igranja igre dama brez vnosa človeškega znanja. Za dosego tega smo uporabili vzpodbujevalno učenje, drevesno preiskovanje Monte Carlo in globoke konvolucijske mreže za ocenitev posameznih stanj v igri. Predstavili smo programe Alpha Go, AlphaGo Zero in AlphaZero, na podlagi katerih je zasnovan naš program. Opisali smo uporabljeno ogrodje in teoretično ozadje uporabljenih pristopov. Uspelo nam je naučiti 9 različic programa, pri čemer je vsaka naslednja različica enakovredna ali boljša kot prejšnja.

Ključne besede

umetna inteligenca;globoko učenje;konvolucijska nevronska mreža;drevesno preiskovanje Monte Carlo;vzpodbujevalno učenje;igra dama;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Založnik: [J. Popič]
UDK: 004.8(043.2)
COBISS: 22848534 Povezava se bo odprla v novem oknu
Št. ogledov: 907
Št. prenosov: 205
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Deep Learning and the game of Checkers
Sekundarni povzetek: In the thesis, we designed a computer program AlphaLady, which is capable of learning to play the game of checkers without human knowledge. To achieve this we have used reinforcement learning, Monte Carlo tree search and deep convolutional neural network for evaluating board positions. Our program is based on the introduced programs Alpha Go, AlphaGo Zero and AlphaZero. We described a framework that was used for implementation and theoretical background of used approaches. We managed to train 9 versions of our program, with each successive version being equal or better than the previous one.
Sekundarne ključne besede: artificial intelligence;deep learning;convolutional neural network;Monte Carlo tree search;reinforcement learning;checkers;
Vrsta dela (COBISS): Diplomsko delo/naloga
Komentar na gradivo: Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Računalništvo in informacijske tehnologije
Strani: XVII, 50 str.
ID: 11205917
Priporočena dela:
, diplomsko delo
, pristop samo-igranja za učenje igranja pretepaške igre z globokim spodbujevalnim učenjem
, ni podatka o podnaslovu