diplomsko delo
Povzetek
V diplomski nalogi smo modelirali povezavo med genotipom in fenotipom tridesetih vzorcev kvasovke S. cerevisiae. Na podlagi podatkov in predznanja smo določili mutacije posameznih nukleotidov in z njimi povezane gene,
s katerimi je možno zgraditi dober model za napovedovanje fenotipa. Poleg določanja pomembnih mest v genomu (SNV-jev) nam zgrajeni model omogoča tudi določevanje pomembnih genotipov oziroma starševskega izvora, ki je povezan z opazovanim fenotipom. Vrednotenje modelov pokaže,
da lahko z linearno regresijo zanesljivo napovedujemo fenotip. Fenotip relativno dobro napoveduje tudi model, ki je zgrajen le na podlagi podatkov o dveh izvornih starših in začetne populacije. Empirično smo določili povezavo
med številom vzorcev, ki jih uporabimo za izgradnjo napovednih modelov, in napovedno napako modelov.
Ključne besede
bioinformatika;genotip;fenotip;posameznik;populacija;linearna regresija;logistična regresija;računalništvo;računalništvo in informatika;računalništvo in matematika;univerzitetni študij;diplomske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2014 |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
Založnik: |
[M. Svetelšek] |
UDK: |
004.9:57(043.2) |
COBISS: |
10718036
|
Št. ogledov: |
49 |
Št. prenosov: |
4 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Predicting the phenotype from genotype data on individual and pooled segregants |
Sekundarni povzetek: |
We have modeled the relationship between genotype and phenotype using data on thirty yeast S. cerevisiae samples. Using prior knowledge, we have determined mutations of individual nucleotides and related genes with which it is possible to build a good prediction model for the phenotype. The constructed models allow us to determine the location of important mutations in the genome (SNVs), to rank samples based on phenotype, and to determine signi_cant genotypes or parental origin, which is connected to the observed phenotype. Evaluation of these models shows that the phenotype can be predicted very reliably with linear regression. The phenotype can be predicted relatively well from data on two starting parents and the _rst pool of segregants. We also show the relation between the number of samples used to build a predictive model and its predictive error. |
Sekundarne ključne besede: |
bioinformatics;genotype;phenotype;individual segregant;pool of segregants;linear regression;logistic regression;computer science;computer and information science;computer science and mathematics;diploma; |
Vrsta datoteke: |
application/pdf |
Vrsta dela (COBISS): |
Diplomsko delo |
Komentar na gradivo: |
Univerza v Ljubljani, Fakulteta za računalništvo in informatiko |
Strani: |
78 str. |
ID: |
24214993 |