diplomsko delo
Povzetek
Cilj diplomskega dela je dodati pravila za pisanje vejice v orodje LanguageTool. S pomočjo analize korpusa Lektor smo raziskali, katera pravila za postavljanje vejic v slovenščini piscem povzročajo največ težav. Glede na dobljene rezultate smo v Slovenskem pravopisu 2001 podrobneje raziskali pravila za pisanje vejice pred vezniki »in«, »ali« ter »da«. Po končani raziskavi smo poskusili implementirati čim več pravil za odprtokodno orodje LanguageTool, ki ga lahko uporabljamo kot samostojen program, spletni vmesnik ali v odprtokodnih pisarniških paketih LibreOffice in OpenOffice. Nekaj pravil smo uspešno implementirali, vendar ne vseh, saj bi za to potrebovali označevalnik besedila, ki ga orodje LanguageTool za slovenski jezik še ne vsebuje. Na koncu smo opravili še evalvacijo pravil, s katero smo preverili njihovo pravilnost, uporabnost in uporabniško izkušnjo.
Ključne besede
LanguageTool;slovenski jezik;vejica;ločila;korpus Lektor;računalništvo;visokošolski strokovni študij;računalništvo in informatika;diplomske naloge;
Podatki
Jezik: |
Slovenski jezik |
Leto izida: |
2015 |
Tipologija: |
2.11 - Diplomsko delo |
Organizacija: |
UL FRI - Fakulteta za računalništvo in informatiko |
Založnik: |
[K. Piškur] |
UDK: |
004.4:811.163.6'35(043.2) |
COBISS: |
1536464067
|
Št. ogledov: |
1013 |
Št. prenosov: |
175 |
Ocena: |
0 (0 glasov) |
Metapodatki: |
|
Ostali podatki
Sekundarni jezik: |
Angleški jezik |
Sekundarni naslov: |
Correcting comma placement in Slovene language with LanguageTool |
Sekundarni povzetek: |
The aim of the thesis is to add the rules for comma usage to the LanguageTool program. Using the Lektor corpus, we examined which rules for comma usage are causing the most issues in written Slovene. In view of these results, we analyzed the rules for comma usage before conjunctions »and«, »or« and »that« in Slovenian ortography 2001. After finishing the analysis, we tried to implement comma placement rules for the open source program LanguageTool, which can be used as a stand-alone desktop application, as web interface or in open source office suites LibreOffice and OpenOffice. Some of the rules were successfully implemented. For all of the rules to be implemented, we would need the part-of-speech tagger, which is not a part of the LanguageTool for Slovene, yet. We evaluated the rules, taking their accuracy, applicability and user experience into account. |
Sekundarne ključne besede: |
LanguageTool;Slovenian language;comma;punctuation marks;Lektor corpus;computer science;computer and information science;diploma; |
Vrsta datoteke: |
application/pdf |
Vrsta dela (COBISS): |
Diplomsko delo/naloga |
Študijski program: |
1000470 |
Konec prepovedi (OpenAIRE): |
1970-01-01 |
Komentar na gradivo: |
Univ. v Ljubljani, Fak. za računalništvo in informatiko |
Strani: |
50 str. |
ID: |
8890381 |