luščenje in prikaz podatkov o jezikovni rabi
Kaja Dobrovoljc (Avtor), Simon Krek (Avtor)

Povzetek

V prispevku predstavljamo proces luščenja in prikazovanja korpusnih podatkov, kakršen je bil vzpostavljen pri pripravi demonstracijskih gesel na spletnem portalu Slogovni priročnik. Kot most med nevtralnimi korpusnimi podatki in vizualizacijo normativnih podatkov na portalu služi leksikon besednih oblik, njihovo pretakanje iz leksikona na portal pa usmerja mehanizem kratkega odgovora, ki omogoča, da se podatki na portalu avtomatsko prilagajajo spremembam v jeziku oz. referenčnem korpusu.

Ključne besede

spletni portal;jezikovni priročniki;standardizacija;pravopis;jezikovne tehnologije;luščenje podatkov;

Podatki

Jezik: Slovenski jezik
Leto izida:
Tipologija: 1.16 - Samostojni znanstveni sestavek ali poglavje v monografski publikaciji
Organizacija: UL FF - Filozofska fakulteta
UDK: 81'22:004.8
COBISS: 27588391 Povezava se bo odprla v novem oknu
Št. ogledov: 9
Št. prenosov: 0
Ocena: 0 (0 glasov)
Metapodatki: JSON JSON-RDF JSON-LD TURTLE N-TRIPLES XML RDFA MICRODATA DC-XML DC-RDF RDF

Ostali podatki

Sekundarni jezik: Angleški jezik
Sekundarni povzetek: The paper presents the process of corpus data extraction and representation for the purpose of creating the Style Guide web portal for Slovene. The neutral corpus data and information about language codification are merged within a lexicon of inflected forms and subsequently visualised through the šshort answer’ system that enables the portal data to automatically adapt to any changes in the language or its reference corpus.
Sekundarne ključne besede: web portal;language reference books;standardisation;normative guide;language technologies;data extraction;
Vrsta dela (COBISS): Članek v reviji
Strani: Str. 101-107
ID: 19519219
Priporočena dela:
, luščenje in prikaz podatkov o jezikovni rabi
, scientific basis and inclusion of the public