magistrsko delo
Tomaž Borštnik (Avtor), Tomaž Curk (Mentor)

Povzetek

Interakcije med proteini in RNA imajo pomembno vlogo pri uravnavanju genske ekspresije in posledično na delovanje celic. Napake v interakcijah so pogosto povezane z nastankom bolezni, kot so nevropatije, rak, itd. Poznavanje mest interakcij je tako nujno za razumevanje, odkrivanje, uravnavanje genske ekspresije in zdravljenje omenjenih bolezni. V magistrskem delu smo se osredotočili na modeliranje mesta interakcije proteinov z RNA na osnovi simuliranih podatkov metode RBDmap, ki je nadaljevanje študije Castella in sodelavcev, objavljene leta 2012. Podatke RBDmap smo simulirani na podlagi zbirke PDB, ki hrani strukture 3D kompleksov proteinov in RNA. Za napovedovanje posameznih aminokislin oziroma krajših zaporedij v fragmentih smo preizkusili vrsto metod strojnega učenja, kot so metoda podpornih vektorjev, klasifikacijska drevesa, naivni Bayesov klasifikator in K-najbližjih sosedov. Razvili smo tudi metodo, ki določi aminokisline v interakciji z RNA na podlagi lastnosti fragmentov aminokislin in celotnega proteina. Uspešnost metode je primerljiva s trenutno obstoječimi metodami (AUC 0,783). V nasprotju s pričakovanji, opisovanje fragmentov v splošnem ni pripomoglo k izboljšanju napovednih modelov.

Ključne besede

gradnja modelov;neuravnoteženi podatki;protein-RNA;PDB;računalništvo;računalništvo in informatika;magisteriji;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 2.09 - Magistrsko delo
Organizacija: UL FRI - Fakulteta za računalništvo in informatiko
Založnik: [T. Borštnik]
UDK: 004.85:577(043.2)
COBISS: 1536579779 Povezava se bo odprla v novem oknu
Št. ogledov: 1421
Št. prenosov: 492
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Prediction of amino acids interacting with RNA
Sekundarni povzetek: Interactions between proteins and RNA play an important role in the regulation of gene expression and therefore in the functioning of cells. Errors in interactions are often related to the development of diseases, such as neuropathy, cancer, etc. To this end, knowing the locations of interactions is crucial for understanding, discovering and managing gene expression and for treating those diseases. The master's thesis focuses on modeling the amino acids interacting with RNA based on simulated data on RBDmap experiments, which is the continuation of the study by Castello et al. from 2012. RBDmap was simulated using the PDB database on 3D structures of ribonucleoprotein complexes. A number of methods of machine learning, such as support vector machines, classification tree, naive Bayes classifier and k-nearest neighbours were evaluated for predicting individual amino acids and fragments of amino acids interacting with RNA. Moreover, a method was developed to determine amino acids interacting with RNA, which considers the characteristics of fragments of amino acids and the entire protein. The method achieved good results (AUC 0.783), which is comparable with current methods. Including features on fragments did not improve the predictive model.
Sekundarne ključne besede: building models;imbalanced data;protein-RNA;PDB;computer science;computer and information science;master's degree;
Vrsta datoteke: application/pdf
Vrsta dela (COBISS): Magistrsko delo/naloga
Študijski program: 1000471
Konec prepovedi (OpenAIRE): 1970-01-01
Komentar na gradivo: Univ. v Ljubljani, Fak. za računalništvo in informatiko
Strani: 56 str.
ID: 9057533