diplomsko delo
Marko Hostnik (Avtor), Luka Čehovin (Mentor)

Povzetek

V nalogi obravnavamo problem vizualnega sledenja objektom, ki ga združimo z uporabo metode s področja spodbujevanega učenja in učenja z učnim načrtom. Implementiramo sledilnik ADNet, ki iterativno izbira akcije, s katerimi sledi objektu. Sledilnik učimo z metodo gradienta strategije in predlagamo izboljšave učenja. Predvsem izboljšamo funkcijo nagrade in stabilnost učenja. Predlagan učni načrt sestavimo iz postopoma težjih umetnih sekvenc slik objektov in ozadij na podlagi dveh domen umetnih objektov. Koristnost učnega načrta na hitrost in uspeh učenja eksperimentalno potrdimo. Pristop primerjamo z uporabo učenja iz ekspertnih demonstracij in ugotovimo, da oba pristopa dosežeta primerljivo dobre rezultate. Uspešni rezultati odpirajo možnosti za nadaljnji razvoj na področju učnih načrtov in uporabe umetnih sekvenc v vizualnem sledenju.

Ključne besede

vizualno sledenje;spodbujevano učenje;učni načrt;računalništvo in informatika;računalništvo in matematika;interdisciplinarni študij;univerzitetni študij;matematika;diplomske naloge;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.11 - Diplomsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [M. Hostnik]
UDK: 004.93(043.2)
COBISS: 76164099 Povezava se bo odprla v novem oknu
Št. ogledov: 483
Št. prenosov: 129
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Learning curriculum for reinforcement learning in visual tracking
Sekundarni povzetek: The thesis addresses the problem of visual object tracking in combination with reinforcement learning methods and the usage of a learning curriculum. We implement the tracker ADNet, which iteratively picks actions to pursue objects. The tracker is trained using a policy gradient method for which we propose certain improvements, especially addressing the reward function and learning stability. The proposed curriculum is constructed from synthetic sequences gradually increasing in difficulty within two domains of synthetic objects. We experimentally show the benefits of using a curriculum on the speed and success of convergence. We compare the proposed method with learning from expert demonstrations and conclude that both methods yield similar results. The promising results from our work lead to further research in the field of curriculum learning and the use of synthetic sequences in visual object tracking.
Sekundarne ključne besede: visual object tracking;reinforcement learning;curriculum learning;computer vision;computer science;computer and information science;computer science and mathematics;interdisciplinary studies;diploma;Računalniški vid;Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS): Diplomsko delo/naloga
Študijski program: 1000407
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 51 str.
ID: 13331895