diplomsko delo
Povzetek
Diplomsko delo obravnava video kompresijo z uporabo nevronskih mrež. V zadnjih letih se je namreč z napredkom strojnega učenja pojavila ideja, da bi se kompresijo slikovnih in video podatkov lahko naučili z ustrezno arhitekturo nevronske mreže in veliko količino učnih podatkov. V nalogi smo se osredotočili na uporabo konvolucijskih samokodirnikov, ki slikovne podatke iz vhodnega prostora preslikajo v bolj kompakten latentni prostor ter nazaj. Predstavimo dva pristopa za kompresijo podatkov, prvi ima za cilj zgolj kompresijo posameznih slik, drugi pa predstavlja nadgradnjo v smeri video kompresije, ki sledi klasičnemu pristopu napovedovanja gibanja delov slike ter kodiranju popravkov. Opisali smo uporabljene arhitekture ter postopek učenja in testiranja. Več pozornosti smo posvetili operaciji kvantizacije, ki je pomemben element preko katerega kontroliramo nivo kompresije in kvaliteto rekonstrukcije. Testirali smo osnovno implementacijo in primerjali zmogljivost v primerjavi z JPEG formatom. Za testiranje druge implementacije smo si izbrali dve konfiguraciji, ju testirali pri različnih parametrih in primerjali s standardnimi kodeki za video kompresijo. Čeprav sta oba pristopa učinkovito kompresirala podatke, nista dosegala trenutnih standardov, zato predstavimo možne izboljšave, s katerimi bi se približali trenutnim standardom.
Ključne besede
video kompresija;konvolucijske nevronske mreže;samokodirniki;kompresijsko ogrodje;računalništvo in informatika;univerzitetni študij;diplomske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2020 |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
Založnik: |
[J. Pelicon] |
UDK: |
004.8(043.2) |
COBISS: |
30808835
|
Št. ogledov: |
968 |
Št. prenosov: |
189 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Video compression using neural networks |
Sekundarni povzetek: |
This bachelor's thesis uses neural networks to compress video. Due to improvements in deep learning, a new idea appeared. Neural networks can learn to compress image and video data using large training sets and appropriate architecture. In the thesis, we used convolutional autoencoders that can transform input data into smaller latent space. We present two approaches to compression. The first one is designed to compress images, while the second is improved to compress video material. It is based on the classic approach of predicting movement in a scene and has error correction. We described used architectures and processes of learning and testing. We focused more on a quantization operation which is an important element for controlling compression ratio and quality. We evaluated the first approach and compared it with the JPEG image compression format. We chose two different configurations for the second approach, tested them using multiple parameters, and compared results with performances of standard codecs. Although both approaches are capable of efficient compression, they can not compete with today's standards. Because of this, we also mentioned some novelties that could significantly improve performance. |
Sekundarne ključne besede: |
video compression;convolutional neural networks;autoencoders;compression framework;computer and information science;diploma thesis; |
Vrsta dela (COBISS): |
Diplomsko delo/naloga |
Študijski program: |
1000468 |
Konec prepovedi (OpenAIRE): |
1970-01-01 |
Komentar na gradivo: |
Univ. v Ljubljani, Fak. za računalništvo in informatiko |
Strani: |
84 str. |
ID: |
12033204 |