diplomsko delo univerzitetnega študijskega programa
Povzetek
V diplomskem delu smo se posvetili generatorjem besedil. Opravili smo analizo obstoječih generatorjev in izdelali preprost eksperimentalni generator besedil, ki tvori besedila v slovenskem jeziku. Temelji na statistiki n-gramov. Za izdelavo programa smo uporabili okolje Code::Blocks, na voljo smo imeli sezname frekvenc besednih unigramov, bigramov in trigramov ter n-gramov z MSD-oznakami. Analizirali smo tvorjena besedila iz dveh scenarijev in podali rezultate ter končni sklep uporabe n-gramov z MSD-oznakami in brez njih.
Ključne besede
generator besedil v naravnem jeziku;Markove verige;n-gramski modeli;
Podatki
| Jezik: |
Slovenski jezik |
| Leto izida: |
2012 |
| Izvor: |
Maribor |
| Tipologija: |
2.11 - Diplomsko delo |
| Organizacija: |
UM FERI - Fakulteta za elektrotehniko, računalništvo in informatiko |
| Založnik: |
[G. Petrović] |
| UDK: |
004.93:621.39(043.2) |
| COBISS: |
16424726
|
| Št. ogledov: |
1375 |
| Št. prenosov: |
98 |
| Ocena: |
0 (0 glasov) |
| Metapodatki: |
|
Ostali podatki
| Sekundarni jezik: |
Angleški jezik |
| Sekundarni naslov: |
Statistical generator of text in Slovenian language |
| Sekundarni povzetek: |
The diploma work analyse text generators. We developed a simple experimental text generator, that generates text in Slovenian language based on n-gram statistics. During the process of development we used Code::Blocks environment and lists of unigrams, bigrams and trigrams of words and n-grams with MSD tags attached. Generated sentences in both scenarios were analyzed and results were presented. We also made a conclusion about using word n-grams and n-grams with MSD tags. |
| Sekundarne ključne besede: |
natural language;Markov chain;n-gram models; |
| URN: |
URN:SI:UM: |
| Vrsta dela (COBISS): |
Diplomsko delo/naloga |
| Komentar na gradivo: |
Univ. v Mariboru, Fak. za elektrotehniko, računalništvo in informatiko, Telekomunikacije |
| Strani: |
IX, 38 f. |
| Ključne besede (UDK): |
science and knowledge;organization;computer science;information;documentation;librarianship;institutions;publications;znanost in znanje;organizacije;informacije;dokumentacija;bibliotekarstvo;institucije;publikacije;prolegomena;fundamentals of knowledge and culture;propaedeutics;prolegomena;splošne osnove znanosti in kulture;computer science and technology;computing;data processing;računalniška znanost in tehnologija;računalništvo;obdelava podatkov;application-oriented computer-based techniques;računalniške tehnike za namensko rabo;aplikativno usmerjene računalniško podprte tehnike;pattern information processing;obdelava informacij v vzorcih;applied sciences;medicine;technology;uporabne znanosti;medicina;tehnika;engineering;technology in general;inženirstvo;tehnologija na splošno;mechanical engineering in general;nuclear technology;electrical engineering;machinery;strojništvo;electrical engineering;elektrotehnika; |
| ID: |
999366 |