magistrsko delo
Lovro Podgoršek (Avtor), Tomaž Curk (Mentor)

Povzetek

Vsako leto se na področju bioinformatike izvede na stotine novih raziskav. Rezultati le teh so razdrobljeni po različnih podatkovnih bazah, ki so med seboj nepovezane, ali pa sploh niso dostopne preko spleta. Vse več znanstvenikov zanima, če bi lahko te podatke združili in izluščili odvisne medsebojne povezave med podatki. V magistrskem delu predlagamo algoritem in podatkovno strukturo za združevanje podatkov ter se osredotočimo na iskanje skritih povezav z večmodalno konvolucijsko nevronsko mrežo tipa samokodirnik. Predlagano rešitev ovrednotimo z algoritmom matričnega razcepa DFMF. V nalogi pokažemo, da stiskanje in razširjanje različnih podatkov v skupen nižje dimenzionalni prostor odkrije odvisne medsebojne povezave med podatki.

Ključne besede

biološki podatki;zlivanje podatkov;samokodirnik;multimodalna nevronska mreža;matrični razcep;računalništvo;računalništvo in informatika;magisteriji;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.09 - Magistrsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [L. Podgoršek]
UDK: 004.8:57(043.2)
COBISS: 1538364867 Povezava se bo odprla v novem oknu
Št. ogledov: 635
Št. prenosov: 221
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Data fusion of biological data using multimodal neural networks and matrix factorization
Sekundarni povzetek: Biological research is conducted yearly in the field of bioinformatics. However, their outcomes and insights remain scattered across different unconnected databases, that are often not accessible online. There is an increased interest in the science community to connect these datasets and uncover potential relationships. The thesis presents an algorithm and data structure for connecting multiple datasets, and thereby focuses on uncovering data relationships with the method of multimodal convolution autoencoder. The solution is evaluated by the DFMF matrix factorization alghorithm. The results show that encoding and decoding data to a common lower dimensional space reveals dependent data relationships.
Sekundarne ključne besede: biological data;data fusion;autoencoder;convolutional neural network;matrix factorization;computer science;computer and information science;master's degree;
Vrsta dela (COBISS): Magistrsko delo/naloga
Študijski program: 1000471
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 72 str.
ID: 11225355