Odkrivanje globokih ponaredkov z video transformerji

diplomsko delo

Tadej Logar (Avtor), Peter Peer (Mentor), Borut Batagelj (Komentor)

Povzetek

V diplomski nalogi se soočamo s problematiko odkrivanja lažnih posnetkov. Lažni posnetki se na spletu pojavljajo vse pogosteje in z uporabo tehnologije globokih ponaredkov (angl. Deepfakes) za ustvarjanje teh posnetkov postajajo tudi tako prepričljivi, da lahko pretentajo ljudi. Cilj globokih ponaredkov je velikokrat širjenje dezinformacij ali omadeževanje ugleda znane osebe. Za namen računalniškega prepoznavanja globokih ponaredkov predstavimo dva sorodna pristopa, ki temeljita na arhitekturi transformerjev in delujeta na osnovi posnetka, za razliko od drugih metod, ki delujejo na osnovi posameznih slik. Imenujeta se Video Vision Transformer (ViViT) in UniFormerV2. Modele teh pristopov smo naučili na podatkovnih zbirkah globokih ponaredkov FaceForensics++ in Celeb-DF-v2. Preizkusili smo tudi zmogljivost modelov na testnem naboru iz zbirke DFDC. S temi modeli smo dosegli rezultate, ki so primerljivi tudi z dosedaj najboljšimi na tem področju. V okviru diplomske naloge opišemo še našo metodologijo, tehnologijo uporabljenih modelov in podrobnosti implementacije. Predstavimo tudi podrobne rezultate, eksperimente ter primerjavo z drugačnimi pristopi pri odkrivanju globokih ponaredkov.

Ključne besede

odkrivanje globokih ponaredkov;globoki ponaredki;lažni posnetki;Video Vision Transformer;UniFormerV2;univerzitetni študij;diplomske naloge;

Podatki

Jezik:	Slovenski jezik
Leto izida:	2024
Tipologija:	2.11 - Diplomsko delo
Organizacija:	UL FRI - Fakulteta za računalništvo in informatiko
Založnik:	[T. Logar]
UDK:	004.85:7.061(043.2)
COBISS:	190633987
Št. ogledov:	53
Št. prenosov:	18
Ocena:	0 (0 glasov)
Metapodatki:

Ostali podatki

Sekundarni jezik:	Angleški jezik
Sekundarni naslov:	Deepfake Detection using Video Transformers
Sekundarni povzetek:	In this bachelor's thesis we examine the task of Deepfake detection. These fake videos are appearing online with increasing frequency. With the use of deep learning for their creation, they have become convincing enough to trick humans. The goal of creating these fake videos is often to spread misinformation or damage the reputations of celebrities. For this task of detecting fake videos, we present two related video-based approaches, with each using the transformer architecture. These approaches are known as the Video Vision Transformer (ViViT) and UniFormerV2. We trained models of these two approaches on two datasets of fake videos, FaceForensics++ and Celeb-DF-v2. We also tested the performance of these models on an additional test set of videos from the DFDC dataset. With the use of these models, we have achieved results comparable to state-of-the-art approaches in this field. As part of the thesis, we describe our methodology, the technologies used in the approaches, and certain implementation details. We also present detailed results of the models we trained, our experiments, and a comparison of our results with some of the different approaches to Deepfake detection.
Sekundarne ključne besede:	deepfake detection;deepfake;deep learning;machine learning;Video Vision Transformer;UniFormerV2;computer science;computer and information science;diploma;Ponarejanje in ponaredki;Globoko učenje (strojno učenje);Računalništvo;Univerzitetna in visokošolska dela;
Vrsta dela (COBISS):	Diplomsko delo/naloga
Študijski program:	1000468
Konec prepovedi (OpenAIRE):	1970-01-01
Komentar na gradivo:	Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani:	43 str.
ID:	23187552