Kompresija video posnetkov z nevronskimi mrežami

diplomsko delo

Jan Pelicon (Avtor), Luka Čehovin (Mentor)

Povzetek

Diplomsko delo obravnava video kompresijo z uporabo nevronskih mrež. V zadnjih letih se je namreč z napredkom strojnega učenja pojavila ideja, da bi se kompresijo slikovnih in video podatkov lahko naučili z ustrezno arhitekturo nevronske mreže in veliko količino učnih podatkov. V nalogi smo se osredotočili na uporabo konvolucijskih samokodirnikov, ki slikovne podatke iz vhodnega prostora preslikajo v bolj kompakten latentni prostor ter nazaj. Predstavimo dva pristopa za kompresijo podatkov, prvi ima za cilj zgolj kompresijo posameznih slik, drugi pa predstavlja nadgradnjo v smeri video kompresije, ki sledi klasičnemu pristopu napovedovanja gibanja delov slike ter kodiranju popravkov. Opisali smo uporabljene arhitekture ter postopek učenja in testiranja. Več pozornosti smo posvetili operaciji kvantizacije, ki je pomemben element preko katerega kontroliramo nivo kompresije in kvaliteto rekonstrukcije. Testirali smo osnovno implementacijo in primerjali zmogljivost v primerjavi z JPEG formatom. Za testiranje druge implementacije smo si izbrali dve konfiguraciji, ju testirali pri različnih parametrih in primerjali s standardnimi kodeki za video kompresijo. Čeprav sta oba pristopa učinkovito kompresirala podatke, nista dosegala trenutnih standardov, zato predstavimo možne izboljšave, s katerimi bi se približali trenutnim standardom.

Ključne besede

video kompresija;konvolucijske nevronske mreže;samokodirniki;kompresijsko ogrodje;računalništvo in informatika;univerzitetni študij;diplomske naloge;

Podatki

Jezik:	Slovenski jezik
Leto izida:	2020
Tipologija:	2.11 - Diplomsko delo
Organizacija:	UL FRI - Fakulteta za računalništvo in informatiko
Založnik:	[J. Pelicon]
UDK:	004.8(043.2)
COBISS:	30808835
Št. ogledov:	968
Št. prenosov:	189
Ocena:	0 (0 glasov)
Metapodatki:

Ostali podatki

Sekundarni jezik:	Angleški jezik
Sekundarni naslov:	Video compression using neural networks
Sekundarni povzetek:	This bachelor's thesis uses neural networks to compress video. Due to improvements in deep learning, a new idea appeared. Neural networks can learn to compress image and video data using large training sets and appropriate architecture. In the thesis, we used convolutional autoencoders that can transform input data into smaller latent space. We present two approaches to compression. The first one is designed to compress images, while the second is improved to compress video material. It is based on the classic approach of predicting movement in a scene and has error correction. We described used architectures and processes of learning and testing. We focused more on a quantization operation which is an important element for controlling compression ratio and quality. We evaluated the first approach and compared it with the JPEG image compression format. We chose two different configurations for the second approach, tested them using multiple parameters, and compared results with performances of standard codecs. Although both approaches are capable of efficient compression, they can not compete with today's standards. Because of this, we also mentioned some novelties that could significantly improve performance.
Sekundarne ključne besede:	video compression;convolutional neural networks;autoencoders;compression framework;computer and information science;diploma thesis;
Vrsta dela (COBISS):	Diplomsko delo/naloga
Študijski program:	1000468
Konec prepovedi (OpenAIRE):	1970-01-01
Komentar na gradivo:	Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani:	84 str.
ID:	12033204