diplomsko delo univerzitetnega študijskega programa
Mario Dietner (Avtor), Milan Ojsteršek (Mentor)

Povzetek

V diplomskem delu smo predstavili koncept podatkovnih baz NOSQL. Našteli smo osnovne skupine, jih opisali in našteli njihove pripadnike. Podrobneje smo se posvetili opisu podatkovnega sistema Apache Cassandra, njegovim lastnostim, delovanju in arhitekturi. Posebej so nas zanimale splošne lastnosti Cassandre, kot so elastičnost, razpoložljivost in ujemljivost podatkov ter zanesljivost in zmogljivost sistema v realnem okolju. V praktičnem delu diplomskega dela smo razvili sistem, ki uporablja Appache Cassandra za generiranje poročil o vsebinski podobnosti med dokumenti. Iskanje plagiatov je časovno zahteven proces, saj z naraščanjem števila dokumentov narašča tudi časovna zahtevnost iskanja. Cassandrina elastičnost in podatkovni model sta idealna rešitev za takšno iskanje. Za izvedbo preizkusa smo uporabili obstoječo bazo izvlečkov (angl. hash), ki smo jih pridobili iz dokumentov Digitalne knjižnice Univerze v Mariboru. To smo prenesli v Cassandrino gručo desetih strežnikov. Čase generiranja poročil smo primerjali s časi, ki smo jih dobili pri generiranju poročil iz podatkovne baze MS SQL. Pokazali smo, da Appache Cassandra 2,2-krat hitreje generira poročila in je neobčutljiva za izpade strežnikov.

Ključne besede

podatkovne baze;NOSQL;detekcija plagiatov;generiranje poročil;podatkovni sistem Appache Casandra;CAP;

Podatki

Jezik: Slovenski jezik
Leto izida:
Izvor: Maribor
Tipologija: 2.11 - Diplomsko delo
Organizacija: UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko
Založnik: [M. Dietner]
UDK: 004.65(043.2)
COBISS: 16235030 Povezava se bo odprla v novem oknu
Št. ogledov: 2686
Št. prenosov: 235
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni naslov: Usage of NOSQL databases for plagiat detector report generation
Sekundarni povzetek: In this diploma thesis we have introduced the concept of NOSQL databases. We described some of the NOSQL groups and represented their members. Next chapters are dedicated to the detailed description of Apache Cassandra, its attributes, architecture and how it works in general. We were especially interested in general attributes of Cassandra, like elastic scaling, availability and data consistency, reliability and performance with a real work load. Further, we developed a system which uses Apache Cassandra to generate reports on content similarity of documents. The search of plagiarism is a time consuming process and for each document added, time complexity grows. The elasticity and the data model of Apache Cassandra are an ideal solution for this problem. For the realization of our performance test, we used an existing database of hash values from the Digital library of the University of Maribor. We transferred those values to our cluster of ten servers and compared the measured report generation times from Apache Cassandra cluster to the measured report generation times from the MS SQL database. We have shown, that Apache Cassandra is generating reports 2,2 times faster and that it is insensitive for server failures.
Sekundarne ključne besede: NOSQL database;Appache Casandra;CAP theorem;plagiat detection;
URN: URN:SI:UM:
Vrsta dela (COBISS): Diplomsko delo
Komentar na gradivo: Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko
Strani: X, 104 str.
Ključne besede (UDK): science and knowledge;organization;computer science;information;documentation;librarianship;institutions;publications;znanost in znanje;organizacije;informacije;dokumentacija;bibliotekarstvo;institucije;publikacije;prolegomena;fundamentals of knowledge and culture;propaedeutics;prolegomena;splošne osnove znanosti in kulture;computer science and technology;computing;data processing;računalniška znanost in tehnologija;računalništvo;obdelava podatkov;data;podatki;databases and their structures;podatkovne zbirke in njihove zgradbe;
ID: 1025943
Priporočena dela:
, diplomsko delo univerzitetnega študijskega programa
, diplomsko delo