diplomsko delo univerzitetnega študijskega programa
Povzetek
V diplomskem delu smo se posvetili generatorjem besedil. Opravili smo analizo obstoječih generatorjev in izdelali preprost eksperimentalni generator besedil, ki tvori besedila v slovenskem jeziku. Temelji na statistiki n-gramov. Za izdelavo programa smo uporabili okolje Code::Blocks, na voljo smo imeli sezname frekvenc besednih unigramov, bigramov in trigramov ter n-gramov z MSD-oznakami. Analizirali smo tvorjena besedila iz dveh scenarijev in podali rezultate ter končni sklep uporabe n-gramov z MSD-oznakami in brez njih.
Ključne besede
generator besedil v naravnem jeziku;Markove verige;n-gramski modeli;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2012 |
Izvor: |
Maribor |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko |
Založnik: |
[G. Petrović] |
UDK: |
004.93:621.39(043.2) |
COBISS: |
16424726
|
Št. ogledov: |
1375 |
Št. prenosov: |
98 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Statistical generator of text in Slovenian language |
Sekundarni povzetek: |
The diploma work analyse text generators. We developed a simple experimental text generator, that generates text in Slovenian language based on n-gram statistics. During the process of development we used Code::Blocks environment and lists of unigrams, bigrams and trigrams of words and n-grams with MSD tags attached. Generated sentences in both scenarios were analyzed and results were presented. We also made a conclusion about using word n-grams and n-grams with MSD tags. |
Sekundarne ključne besede: |
natural language;Markov chain;n-gram models; |
URN: |
URN:SI:UM: |
Vrsta dela (COBISS): |
Diplomsko delo/naloga |
Komentar na gradivo: |
Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Telekomunikacije |
Strani: |
IX, 38 f. |
Ključne besede (UDK): |
science and knowledge;organization;computer science;information;documentation;librarianship;institutions;publications;znanost in znanje;organizacije;informacije;dokumentacija;bibliotekarstvo;institucije;publikacije;prolegomena;fundamentals of knowledge and culture;propaedeutics;prolegomena;splošne osnove znanosti in kulture;computer science and technology;computing;data processing;računalniška znanost in tehnologija;računalništvo;obdelava podatkov;application-oriented computer-based techniques;računalniške tehnike za namensko rabo;aplikativno usmerjene računalniško podprte tehnike;pattern information processing;obdelava informacij v vzorcih;applied sciences;medicine;technology;uporabne znanosti;medicina;tehnika;engineering;technology in general;inženirstvo;tehnologija na splošno;mechanical engineering in general;nuclear technology;electrical engineering;machinery;strojništvo;electrical engineering;elektrotehnika; |
ID: |
999366 |