(magistrsko delo)
Povzetek
Uvod: Genomska anotacija je ključen korak po sekvenciranju DNA, saj nam pomaga identificirati ključne funkcionalne elemente nukleotidnega zaporedja ter nam s tem priskrbi pomen nukleotidnega zaporedja, ki nas zanima. Eksom je definiran kot nukleotidno zaporedje, ki obsega vse eksome vseh genov, ki kodirajo proteine v genomu. Eksom predstavlja med 1 in 2 % celotnega genoma, vsebuje pa kar 85 % znanih različic, ki povzročajo bolezni.
Metode: V empiričnem delu naloge smo v začetku zbrali vsa izbrana orodja za anotacijo in jih naložili na naš namizni računalnik, nato pa smo z vsakim od orodij izvedli anotacijo na podatkih pridobljenih v laboratoriju Centra za humano molekularno genetiko in farmakogenomiko Medicinske fakultete Univerze v Mariboru s sekvenciranjem naslednje generacije DNA izoliranih iz 24 bolnikov. Podatke sekvenciranja eksoma v VCF formatu smo analiziraliz bioinformatskimi orodji ANNOVAR, Exomiser, VarAFT, SnpEff in Ensembl VEP. Vsa orodja z izjemo VarAFT so orodja, ki se zaganjajo iz ukaznega poziva, medtem ko VafAFT deluje kot samostojna aplikacija. Ko smo zaključili z anotacijo vseh vzorcev, smo v teh anotiranih vzorcih skušali poiskati vzročne mutacije, ki smo jih pridobili predhodno, pri čemer smo uporabili tudi orodje za filtriranje SnpSift.
Rezultati: Rezultati anotacije z izbranimi orodji so se med posameznimi orodji nekoliko razlikovali pri vrednostih vmesnih parametrov, ki jih orodja izračunajo na podlagi svojih algoritmov, medtem ko smo pri zaznavanju tipov in lokacij različic ter tega, kaj določena različica povzroči, dobili dokaj podobne rezultate. Rezultati primerjave orodij, ki smo jo izvedli na podlagi tega, ali je orodje zaznalo vzročno mutacijo v vzorcu, pa so nam pokazali, da se orodja med seboj kar precej razlikujejo, saj je orodje ANNOVAR zaznalo 50 % vseh vzročnih mutacij, VarAFT 35,7 %, Exomiser 28,5 %, medtem ko sta orodji SnpEff in VEP zaznali le 21,4 % vseh vzročnih mutacij.
Diskusija: Ugotovili smo, da je bilo orodje ANNOVAR najuspešnejše pri zaznavanju vzročnih mutacij. Zaradi majhnega števila vzorcev (14 vzročnih mutacij v 24 vzorcih) bo rezultate naše primerjave učinkovitosti preiskovanih orodij potrebno potrditi še na večjem številu vzorcev.
Ključne besede
NGS;anotacija;bioinformatika;eksom;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2021 |
Tipologija: |
2.09 - Magistrsko delo |
Organizacija: |
UM FZV - Fakulteta za zdravstvene vede |
Založnik: |
[M. Toplak] |
UDK: |
575.112(043.2) |
COBISS: |
92294147
|
Št. ogledov: |
331 |
Št. prenosov: |
36 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Comparison of bioinformatic tools for annotation of exome data obtained with dna next-generation sequencing |
Sekundarni povzetek: |
Introduction: Genomic annotation is a key step that comes in place, once we are done with the sequencing of DNA, because it helps us to identify importnant functional elements of the sequence as well as provides us with the meaning of the nuceotide sequence of interest. Exome is defined as a sequence which conatins all exones of the protein coding genes in genome and it represents between 1% and 2% of total genome, however it contains about 85% of variants that are known to cause medical conditions.
Methods: In the empirical part, first we downloaded and installed all of the selected annotation tools to our desktop computer and then we performed annotation on all of our 24 samples, all of which were in VCF format and previously analyzed at Center for human genetics and pharmacogenomics Faculty of Medicine, University of Maribor. The tools we selected for the thesis were ANNOVAR, Exomiser, VarAFT, SnpEff and Ensembl VEP. All of those tools with an exception of VarAFT, which works as a stand alone application, are command line tools. Once we were done with the annotation process of all of our samples, we inspected our annotated samples for a previously obtained positive findings with a help of SnpSift filtering tool.
Results: Obtained annotation results with selected tools have shown some different values of some annotated attributes, while the results of variant types and their locations as well as the consequences of a variant present, were similar. Tools were then compared based on whether they were able to detect a positive finding in a sample. The results of the comparisson showed that the tools differed between each other since ANNOVAR was able to detect 50% of all the positive findings, VarAFT detected 35,7%, Exmosier detected 28,5%, while SnpEff and VEP both detected only 21,4% of all findings.
Conclusion: ANNOVAR tool was the most successful tool based on its ability to detect a positive finding in samples, at this point we also have to mention a fact that this results do not hold a strong statistical power since we only had 14 positive findings in all of the 24 samples. |
Sekundarne ključne besede: |
NGS;annotation;bioinformatics;exome;Exosomes;DNA;Eksosomi; |
Vrsta dela (COBISS): |
Magistrsko delo/naloga |
Komentar na gradivo: |
Univ. v Mariboru, Fak. za zdravstvene vede |
Strani: |
VIII, 81 str. |
ID: |
13758200 |